← Słownik AI

Definicja

Baza wektorowa

Baza wektorowa przechowuje embeddingi i pozwala szybko wyszukiwać semantycznie podobne dokumenty, obrazy lub rekordy.

Znane też jako: vector database, vector store

Krótka definicja

Baza wektorowa przechowuje embeddingi i obsługuje wyszukiwanie podobieństwa. Zamiast szukać dokładnych słów kluczowych, aplikacja może znaleźć elementy bliskie znaczeniowo.

Jak to działa

Dokumenty są zamieniane na embeddingi, zapisywane z metadanymi i indeksowane. Gdy użytkownik zada pytanie, ono też jest zamieniane na wektor, a baza zwraca najbliższe fragmenty.

Przykład

W asystencie RAG baza wektorowa może odszukać najtrafniejsze akapity polityki firmowej, zanim model językowy napisze odpowiedź.

Dlaczego to ważne

Bazy wektorowe są kluczowe dla wyszukiwania semantycznego, rekomendacji i asystentów wiedzy. Nie naprawiają jednak słabych danych - jakość zależy od dokumentów, embeddingów, metadanych i ewaluacji.

Baza wektorowa a zwykła baza danych

Relacyjna baza danych odpowiada najlepiej na precyzyjne warunki: identyfikator, data, status albo cena. Baza wektorowa szuka elementów podobnych znaczeniowo. Oba mechanizmy często działają razem: filtr SQL ogranicza wyniki do dokumentów użytkownika, a wyszukiwanie wektorowe wybiera z nich najtrafniejsze fragmenty.

Na co uważać

Najczęstszy błąd to traktowanie wyniku podobieństwa jak dowodu poprawności. Indeks może zwrócić fragment brzmiący podobnie, lecz nieodpowiadający na pytanie. Dlatego trzeba testować chunking, model embeddingowy, liczbę wyników oraz progi trafności. Ważne są też uprawnienia: wyszukiwanie nie może ujawnić dokumentu, którego użytkownik nie ma prawa odczytać.