Векторний індекс проти векторної бази даних, чітко пояснено! Більшість людей використовують ці терміни як синоніми. Це помилка. Подумайте про це так: Векторний індекс — це алгоритм. Він бере ваші вектори, організовує їх у пошукову структуру (як у HNSW) і швидко знаходить схожі елементи. FAISS — гарний приклад. Але сам алгоритм не справляється зі зберіганням, фільтрацією чи масштабуванням. Він просто шукає. Векторна база даних обгортає цей індекс усім іншим, що вам потрібно — розподіленим сховищем, фільтрацією метаданих, збереженням і одночасним доступом. Це також дає гнучкість у тому, як індексувати. HNSW, ЕКЗ, DiskANN — різні методи для різних компромісів між швидкістю, точністю та пам'яттю. Мілвус — гарний приклад. Отже, один — це компонент. Інший — це система. Ця різниця здається академічною, поки не досягнеш масштабу. Тоді це стає дорогим. Компанія з автономного водіння зрозуміла це на власному досвіді. Вони створювали систему пошуку відео з водіння — величезного масштабу. Кожна поїздка генерує кадри; кожен кадр стає векторним вкладенням. Інженерам потрібно було шукати сценарії, як-от «нічні міські перехрестя з пішоходами», через місяці даних. FAISS був природною відправною точкою. Швидкий, легкий, простий у встановленні. Але з ростом даних щоденні вкладення ставали окремим індексним файлом. Місяці потому: сотні тисяч ізольованих файлів. ...