Definicja
Sieć neuronowa
Sieć neuronowa to model z połączonych warstw, który przekształca dane wejściowe w predykcje, klasyfikacje lub wygenerowane wyniki.
Krótka definicja
Sieć neuronowa to model matematyczny zbudowany z połączonych warstw. Przyjmuje dane wejściowe, przetwarza je krok po kroku i zwraca wynik, na przykład etykietę, ocenę, token tekstu albo reprezentację obrazu.
Jak to działa
Połączenia w sieci mają wagi. Podczas treningu model porównuje swój wynik z oczekiwanym rezultatem i koryguje wagi tak, aby zmniejszyć błąd. Powtarzanie tego procesu na wielu przykładach pozwala uczyć się wzorców.
Przykład
W klasyfikacji obrazów sieć może otrzymać piksele i zwrócić prawdopodobieństwa klas, takich jak kot, pies lub samochód. W języku może przetwarzać tokeny i przewidywać następny fragment tekstu.
Dlaczego to ważne
Sieci neuronowe są fundamentem głębokiego uczenia. Są elastyczne i skuteczne, ale trudniejsze do interpretacji niż proste reguły, dlatego wymagają testów i monitorowania.
Co oznaczają warstwy
Pierwsza warstwa odbiera dane, warstwy ukryte tworzą kolejne reprezentacje, a warstwa wyjściowa zwraca wynik. „Neuron” nie jest biologiczną komórką, tylko operacją matematyczną łączącą wartości wejściowe, wagi i funkcję aktywacji. Porównanie do mózgu jest użyteczną metaforą, ale nie powinno być traktowane dosłownie.
Kiedy sieć może zawieść
Model uczy się zależności obecnych w danych, również przypadkowych. Może działać dobrze na przykładach podobnych do treningowych, a słabo po zmianie oświetlenia, języka lub zachowania klientów. Z tego powodu ważne są dane walidacyjne, regularizacja, monitoring oraz testy na przypadkach, których sieć wcześniej nie widziała.