← Słownik AI

Definicja

Sieć neuronowa

Sieć neuronowa to model z połączonych warstw, który przekształca dane wejściowe w predykcje, klasyfikacje lub wygenerowane wyniki.

Znane też jako: ANN, sztuczna sieć neuronowa

Krótka definicja

Sieć neuronowa to model matematyczny zbudowany z połączonych warstw. Przyjmuje dane wejściowe, przetwarza je krok po kroku i zwraca wynik, na przykład etykietę, ocenę, token tekstu albo reprezentację obrazu.

Jak to działa

Połączenia w sieci mają wagi. Podczas treningu model porównuje swój wynik z oczekiwanym rezultatem i koryguje wagi tak, aby zmniejszyć błąd. Powtarzanie tego procesu na wielu przykładach pozwala uczyć się wzorców.

Przykład

W klasyfikacji obrazów sieć może otrzymać piksele i zwrócić prawdopodobieństwa klas, takich jak kot, pies lub samochód. W języku może przetwarzać tokeny i przewidywać następny fragment tekstu.

Dlaczego to ważne

Sieci neuronowe są fundamentem głębokiego uczenia. Są elastyczne i skuteczne, ale trudniejsze do interpretacji niż proste reguły, dlatego wymagają testów i monitorowania.

Co oznaczają warstwy

Pierwsza warstwa odbiera dane, warstwy ukryte tworzą kolejne reprezentacje, a warstwa wyjściowa zwraca wynik. „Neuron” nie jest biologiczną komórką, tylko operacją matematyczną łączącą wartości wejściowe, wagi i funkcję aktywacji. Porównanie do mózgu jest użyteczną metaforą, ale nie powinno być traktowane dosłownie.

Kiedy sieć może zawieść

Model uczy się zależności obecnych w danych, również przypadkowych. Może działać dobrze na przykładach podobnych do treningowych, a słabo po zmianie oświetlenia, języka lub zachowania klientów. Z tego powodu ważne są dane walidacyjne, regularizacja, monitoring oraz testy na przypadkach, których sieć wcześniej nie widziała.