Definicja
Baza wektorowa
Baza wektorowa przechowuje embeddingi i pozwala szybko wyszukiwać semantycznie podobne dokumenty, obrazy lub rekordy.
Krótka definicja
Baza wektorowa przechowuje embeddingi i obsługuje wyszukiwanie podobieństwa. Zamiast szukać dokładnych słów kluczowych, aplikacja może znaleźć elementy bliskie znaczeniowo.
Jak to działa
Dokumenty są zamieniane na embeddingi, zapisywane z metadanymi i indeksowane. Gdy użytkownik zada pytanie, ono też jest zamieniane na wektor, a baza zwraca najbliższe fragmenty.
Przykład
W asystencie RAG baza wektorowa może odszukać najtrafniejsze akapity polityki firmowej, zanim model językowy napisze odpowiedź.
Dlaczego to ważne
Bazy wektorowe są kluczowe dla wyszukiwania semantycznego, rekomendacji i asystentów wiedzy. Nie naprawiają jednak słabych danych - jakość zależy od dokumentów, embeddingów, metadanych i ewaluacji.
Baza wektorowa a zwykła baza danych
Relacyjna baza danych odpowiada najlepiej na precyzyjne warunki: identyfikator, data, status albo cena. Baza wektorowa szuka elementów podobnych znaczeniowo. Oba mechanizmy często działają razem: filtr SQL ogranicza wyniki do dokumentów użytkownika, a wyszukiwanie wektorowe wybiera z nich najtrafniejsze fragmenty.
Na co uważać
Najczęstszy błąd to traktowanie wyniku podobieństwa jak dowodu poprawności. Indeks może zwrócić fragment brzmiący podobnie, lecz nieodpowiadający na pytanie. Dlatego trzeba testować chunking, model embeddingowy, liczbę wyników oraz progi trafności. Ważne są też uprawnienia: wyszukiwanie nie może ujawnić dokumentu, którego użytkownik nie ma prawa odczytać.