Definicja
Uczenie nienadzorowane
Uczenie nienadzorowane znajduje wzorce, grupy lub strukturę w danych bez gotowych etykiet i poprawnych odpowiedzi.
Krótka definicja
Uczenie nienadzorowane to podejście, w którym model otrzymuje dane bez gotowych etykiet. Próbuje sam odkryć strukturę, podobieństwa, grupy lub nietypowe przypadki.
Jak to działa
Model może grupować podobne rekordy, zmniejszać liczbę wymiarów danych albo wykrywać punkty odstające. W przeciwieństwie do uczenia nadzorowanego nie ma jednej poprawnej odpowiedzi dla każdego przykładu.
Przykład
Sklep internetowy może pogrupować klientów według zachowań zakupowych i przeglądania. Takie segmenty pomagają zrozumieć odbiorców, nawet jeśli nikt wcześniej ich ręcznie nie opisał.
Dlaczego to ważne
Uczenie nienadzorowane jest przydatne, gdy etykiety są drogie lub niedostępne. Sprawdza się w eksploracji danych, segmentacji, anomaliach i embeddingach, ale wyniki wymagają interpretacji człowieka.
Wynik nie zawsze ma oczywistą nazwę
Algorytm może utworzyć grupy, które są matematycznie wyraźne, ale biznesowo nieprzydatne. Segmenty trzeba opisać, porównać i sprawdzić w czasie. Zmiana liczby klastrów albo sposobu skalowania cech może prowadzić do zupełnie innego podziału.
Ryzyko błędnej interpretacji
Punkt odstający nie musi oznaczać oszustwa, a podobieństwo nie potwierdza związku przyczynowego. Uczenie nienadzorowane dobrze generuje hipotezy i wskazuje przypadki do sprawdzenia, lecz rzadko powinno samodzielnie podejmować decyzję o poważnych konsekwencjach. W praktyce często stanowi pierwszy etap analizy przed oznaczeniem danych lub oceną eksperta.