Definicja
Uczenie nadzorowane
Uczenie nadzorowane trenuje modele na opisanych przykładach, aby przewidywały etykiety, wyniki lub wartości dla nowych danych.
Krótka definicja
Uczenie nadzorowane to scenariusz, w którym każdy przykład treningowy zawiera dane wejściowe i poprawną odpowiedź. Model uczy się mapować wejścia na wyniki, a potem jest testowany na nowych przypadkach.
Jak to działa
Dane mogą łączyć transakcje z etykietą oszustwa, zdjęcia z nazwami obiektów albo rekordy klientów z informacją o rezygnacji. Model przewiduje wynik, porównuje go z etykietą i poprawia swoje parametry.
Przykład
Bank może trenować model na historycznych transakcjach oznaczonych jako prawidłowe lub podejrzane. Przy nowej transakcji model ocenia prawdopodobieństwo ryzyka.
Dlaczego to ważne
Uczenie nadzorowane jest bardzo praktyczne, gdy istnieją dobre etykiety. Jakość modelu zależy jednak od jakości oznaczeń, pokrycia danych i testów. Błędne lub stronnicze etykiety prowadzą do błędnych predykcji.
Podział danych
Przykłady zwykle dzieli się na zbiór treningowy, walidacyjny i testowy. Model uczy się na pierwszym, decyzje projektowe podejmuje się na drugim, a końcowy wynik sprawdza na trzecim. Dane testowe nie powinny przenikać do treningu, ponieważ wtedy wynik będzie sztucznie zawyżony.
Dobór metryki
Sama dokładność może być myląca. Jeżeli oszustwo występuje w jednej transakcji na tysiąc, model zawsze odpowiadający „brak oszustwa” osiągnie wysoką dokładność, ale będzie bezużyteczny. W takich zadaniach ocenia się między innymi precyzję, czułość, koszt fałszywego alarmu i koszt przeoczenia.