← Słownik AI

Definicja

Duży model językowy

Duży model językowy to model AI trenowany na dużych zbiorach tekstu i kodu, aby przewidywać, generować i przekształcać język.

Znane też jako: LLM, model językowy

Krótka definicja

Duży model językowy to rodzaj modelu AI zaprojektowany do pracy z językiem. Potrafi generować tekst, streszczać dokumenty, tłumaczyć, klasyfikować treści, pisać kod i odpowiadać na pytania.

LLM-y są dziś jednym z najważniejszych elementów ekosystemu sztucznej inteligencji.

Jak to działa

Model jest trenowany na ogromnych zbiorach tekstu, kodu i innych danych. W trakcie treningu uczy się statystycznych wzorców języka: gramatyki, stylu, relacji między pojęciami i sposobów rozwiązywania zadań.

Podczas użycia model otrzymuje prompt i generuje najbardziej prawdopodobną kontynuację. Dlatego tak ważna jest inżynieria promptów, czyli jasne instrukcje, kontekst i ograniczenia.

Przykład

Zespół prawny może poprosić LLM o streszczenie klauzuli umowy, porównanie dwóch wersji dokumentu albo przygotowanie pierwszej wersji wyjaśnienia dla klienta. Wynik nadal powinien przejść kontrolę człowieka.

Ograniczenia

Duże modele językowe mogą tworzyć płynne, ale błędne odpowiedzi. Nie wiedzą automatycznie, czy wygenerowane zdanie jest aktualne, kompletne i prawdziwe.

Ryzyko zmniejsza się przez RAG, testy, reguły bezpieczeństwa i procesy, w których człowiek weryfikuje ważne decyzje.