Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Векторний індекс проти векторної бази даних, чітко пояснено!
Більшість людей використовують ці терміни як синоніми. Це помилка.
Подумайте про це так:
Векторний індекс — це алгоритм. Він бере ваші вектори, організовує їх у пошукову структуру (як у HNSW) і швидко знаходить схожі елементи. FAISS — гарний приклад.
Але сам алгоритм не справляється зі зберіганням, фільтрацією чи масштабуванням. Він просто шукає.
Векторна база даних обгортає цей індекс усім іншим, що вам потрібно — розподіленим сховищем, фільтрацією метаданих, збереженням і одночасним доступом.
Це також дає гнучкість у тому, як індексувати. HNSW, ЕКЗ, DiskANN — різні методи для різних компромісів між швидкістю, точністю та пам'яттю. Мілвус — гарний приклад.
Отже, один — це компонент. Інший — це система.
Ця різниця здається академічною, поки не досягнеш масштабу. Тоді це стає дорогим.
Компанія з автономного водіння зрозуміла це на власному досвіді.
Вони створювали систему пошуку відео з водіння — величезного масштабу. Кожна поїздка генерує кадри; кожен кадр стає векторним вкладенням.
Інженерам потрібно було шукати сценарії, як-от «нічні міські перехрестя з пішоходами», через місяці даних.
FAISS був природною відправною точкою. Швидкий, легкий, простий у встановленні.
Але з ростом даних щоденні вкладення ставали окремим індексним файлом.
Місяці потому: сотні тисяч ізольованих файлів.
...
Найкращі
Рейтинг
Вибране
