Definicja
Generowanie wspomagane wyszukiwaniem
Generowanie wspomagane wyszukiwaniem łączy model językowy z zewnętrzną wiedzą, aby odpowiedzi opierały się na dokumentach lub danych.
Krótka definicja
Generowanie wspomagane wyszukiwaniem, znane jako RAG, to wzorzec, w którym duży model językowy otrzymuje dodatkowy kontekst z dokumentów, bazy wiedzy albo wyszukiwarki.
Model nie odpowiada wtedy wyłącznie na podstawie tego, czego nauczył się podczas treningu. Najpierw pobierane są istotne fragmenty źródeł, a dopiero potem model tworzy odpowiedź.
Jak to działa
Najprostszy pipeline RAG ma trzy kroki. Najpierw dokumenty są indeksowane, aby można je było przeszukiwać. Potem pytanie użytkownika jest dopasowywane do najważniejszych fragmentów. Na końcu te fragmenty trafiają do modelu razem z instrukcją odpowiedzi.
RAG nie gwarantuje idealnej poprawności, ale zwykle poprawia aktualność, weryfikowalność i dopasowanie odpowiedzi do konkretnej domeny.
Przykład
Firma może stworzyć wewnętrznego asystenta korzystającego z polityk HR, dokumentacji produktu i procedur wsparcia. Gdy pracownik zada pytanie, system znajduje odpowiednie fragmenty i prosi model o odpowiedź na ich podstawie.
Dlaczego to ważne
RAG jest jednym z najbardziej praktycznych sposobów wdrażania modeli językowych w firmach. Pozwala korzystać z aktualnej wiedzy bez trenowania modelu od zera i ogranicza halucynacje.
Jakość takiego systemu zależy jednak od jakości dokumentów, podziału treści na fragmenty, trafności wyszukiwania, promptu i testów. Słabe wyszukiwanie nadal może prowadzić do słabych odpowiedzi.