Indeks wektorowy a baza danych wektorów, jasno wyjaśnione! Większość ludzi używa tych terminów zamiennie. To błąd. Pomyśl o tym w ten sposób: Indeks wektorowy to algorytm. Bierze twoje wektory, organizuje je w strukturę, którą można przeszukiwać (jak HNSW) i szybko znajduje podobne elementy. FAISS to dobry przykład. Ale sam algorytm nie zajmuje się przechowywaniem, filtrowaniem ani skalowaniem. Po prostu przeszukuje. Baza danych wektorów otacza ten indeks wszystkim, czego potrzebujesz - rozproszonym przechowywaniem, filtrowaniem metadanych, trwałością i równoczesnym dostępem. Daje również elastyczność w tym, jak indeksujesz. HNSW, IVF, DiskANN - różne techniki dla różnych kompromisów między szybkością, dokładnością a pamięcią. Milvus to dobry przykład. Więc jedno to komponent. Drugie to system. To rozróżnienie wydaje się akademickie, dopóki nie napotkasz skali. Wtedy staje się kosztowne. Firma zajmująca się autonomiczną jazdą nauczyła się tego w trudny sposób. Budowali system wyszukiwania dla nagrań z jazdy - na ogromną skalę. Każda podróż generuje klatki; każda klatka staje się osadzeniem wektora. Inżynierowie musieli zapytać o scenariusze takie jak "nocne miejskie skrzyżowania z pieszymi" w ciągu miesięcy danych. FAISS był naturalnym punktem wyjścia. Szybki, lekki, łatwy do skonfigurowania. Ale w miarę wzrostu danych, osadzenia każdego dnia stały się osobnym plikiem indeksu. Miesiące później: setki tysięcy izolowanych plików. ...