Definicja
Duży model językowy
Duży model językowy to model AI trenowany na dużych zbiorach tekstu i kodu, aby przewidywać, generować i przekształcać język.
Krótka definicja
Duży model językowy to rodzaj modelu AI zaprojektowany do pracy z językiem. Potrafi generować tekst, streszczać dokumenty, tłumaczyć, klasyfikować treści, pisać kod i odpowiadać na pytania.
LLM-y są dziś jednym z najważniejszych elementów ekosystemu sztucznej inteligencji.
Jak to działa
Model jest trenowany na ogromnych zbiorach tekstu, kodu i innych danych. W trakcie treningu uczy się statystycznych wzorców języka: gramatyki, stylu, relacji między pojęciami i sposobów rozwiązywania zadań.
Podczas użycia model otrzymuje prompt i generuje najbardziej prawdopodobną kontynuację. Dlatego tak ważna jest inżynieria promptów, czyli jasne instrukcje, kontekst i ograniczenia.
Przykład
Zespół prawny może poprosić LLM o streszczenie klauzuli umowy, porównanie dwóch wersji dokumentu albo przygotowanie pierwszej wersji wyjaśnienia dla klienta. Wynik nadal powinien przejść kontrolę człowieka.
Ograniczenia
Duże modele językowe mogą tworzyć płynne, ale błędne odpowiedzi. Nie wiedzą automatycznie, czy wygenerowane zdanie jest aktualne, kompletne i prawdziwe.
Ryzyko zmniejsza się przez RAG, testy, reguły bezpieczeństwa i procesy, w których człowiek weryfikuje ważne decyzje.