Definicja
Halucynacja AI
Halucynacja AI to pewnie brzmiąca odpowiedź modelu, która jest fałszywa, zmyślona albo nieoparta na dostarczonym kontekście.
Krótka definicja
Halucynacja AI to wynik, który wygląda wiarygodnie, ale jest błędny, zmyślony albo nie ma potwierdzenia w źródłach. Najczęściej mówi się tak o modelach językowych generujących fałszywe fakty lub fikcyjne cytowania.
W praktyce halucynacja nie zawsze wygląda jak oczywista bzdura. Często jest to odpowiedź napisana dobrym stylem, z poprawną strukturą i pewnym tonem, ale oparta na założeniu, którego model nie sprawdził. Dlatego jest tak podstępna: użytkownik widzi płynną, logiczną wypowiedź, a nie mechanizm, który tylko przewiduje najbardziej prawdopodobną sekwencję tekstu.
Jak powstaje
Model językowy generuje prawdopodobny tekst, a nie gwarantowaną prawdę. Jeśli prompt jest niejasny, brakuje kontekstu albo zadanie wymaga dokładnych faktów, model może wypełnić luki prawdopodobnie brzmiącymi treściami.
Do halucynacji dochodzi szczególnie łatwo wtedy, gdy model:
- nie ma dostępu do aktualnych danych,
- otrzymuje zbyt mało kontekstu,
- dostaje sprzeczne lub nieprecyzyjne instrukcje,
- ma odpowiedzieć na pytanie, na które nie ma wystarczających informacji,
- jest proszony o cytaty, źródła, liczby lub szczegóły prawne bez narzędzi weryfikacji.
Ważne jest też to, że model może mieszać prawdziwe elementy z fałszywymi. Na przykład poda poprawną nazwę firmy i realne nazwisko prezesa, ale dopisze nieistniejący raport, datę albo wypowiedź. Taki błąd jest trudniejszy do wykrycia niż odpowiedź całkowicie oderwana od rzeczywistości.
Rodzaje halucynacji
Najczęściej spotyka się kilka typów halucynacji:
- faktyczne: model podaje błędną datę, nazwisko, wynik finansowy, definicję lub wydarzenie;
- źródłowe: model tworzy nieistniejące linki, publikacje, cytaty, autorów albo numery spraw;
- kontekstowe: model odpowiada poza dostarczonym materiałem, chociaż miał trzymać się dokumentu;
- logiczne: odpowiedź zawiera pozornie spójne rozumowanie, ale wniosek nie wynika z przesłanek;
- formatowe: model zwraca dane w oczekiwanym formacie, ale część pól jest zmyślona.
W systemach biznesowych najgroźniejsze są zwykle halucynacje kontekstowe i źródłowe. Użytkownik zakłada, że odpowiedź pochodzi z firmowej bazy wiedzy, dokumentacji lub przywołanego źródła, a tymczasem model dopowiedział brakujące fragmenty.
Przykład
Model może streścić sprawę prawną i dodać nieistniejące orzeczenie. Odpowiedź brzmi profesjonalnie, ale źródło jest zmyślone.
Inny przykład: użytkownik pyta asystenta firmowego o zasady zwrotu kosztów podróży. Model poprawnie cytuje część regulaminu, ale dodaje limit kwotowy, którego nie ma w dokumencie. Taka odpowiedź może wyglądać niewinnie, ale w praktyce prowadzi do błędnych decyzji operacyjnych.
Halucynacje pojawiają się też w kodzie. Model może zaproponować metodę biblioteki, która brzmi zgodnie z konwencją nazewnictwa, ale w rzeczywistości nie istnieje. Programista dostaje wtedy kod, który wygląda wiarygodnie, lecz nie przechodzi kompilacji albo działa inaczej, niż sugeruje opis.
Dlaczego to ważne
Halucynacje są jednym z głównych powodów, dla których wyniki AI trzeba testować. Pomagają RAG, cytowania, ograniczone formaty, walidacja narzędziowa i kontrola człowieka przy ważnych decyzjach.
Problem nie polega na tym, że modele czasem się mylą. Problem polega na tym, że potrafią mylić się w sposób bardzo przekonujący. W prostych zastosowaniach, takich jak burza mózgów albo szkic tekstu, ryzyko jest ograniczone. W obsłudze klienta, medycynie, finansach, prawie, cyberbezpieczeństwie czy raportowaniu zarządczym halucynacja może oznaczać realną stratę, błędną poradę lub naruszenie zgodności.
Dlatego w dojrzałych wdrożeniach AI nie zakłada się, że model zawsze odpowie poprawnie. Projektuje się proces, który pozwala wykrywać niepewność, sprawdzać źródła i ograniczać skutki błędów.
Jak ograniczać halucynacje
Nie da się ich całkowicie wyeliminować, ale można mocno zmniejszyć ryzyko. Najbardziej praktyczne metody to:
- używanie RAG, aby model odpowiadał na podstawie konkretnych dokumentów;
- wymaganie cytatów lub odwołań do fragmentów źródłowych;
- instruowanie modelu, aby mówił „nie wiem”, gdy brakuje danych;
- ograniczanie formatu odpowiedzi, na przykład do pól JSON, tabeli lub listy kontrolnej;
- sprawdzanie faktów przez narzędzia, API, bazę danych albo wyszukiwarkę;
- testowanie odpowiedzi na zestawie typowych i trudnych pytań;
- zostawianie decyzji wysokiego ryzyka człowiekowi.
Dobry prompt pomaga, ale sam prompt nie jest wystarczającym zabezpieczeniem. Najlepsze efekty daje połączenie instrukcji, dobrego kontekstu, automatycznej walidacji i jasnych zasad, kiedy odpowiedź AI wymaga zatwierdzenia.
Jak rozpoznać halucynację
Sygnałem ostrzegawczym są bardzo konkretne szczegóły bez źródeł: daty, kwoty, cytaty, nazwy raportów, sygnatury spraw, numery wersji albo linki. Warto też uważać na odpowiedzi, które brzmią zbyt gładko mimo braku danych wejściowych.
Jeżeli wynik ma wpływ na decyzję, należy sprawdzić go poza modelem. Najprostsza zasada brzmi: im większa pewność tonu i im większe konsekwencje błędu, tym bardziej potrzebna jest weryfikacja.