Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Векторный индекс против векторной базы данных, четко объяснено!
Большинство людей используют эти термины взаимозаменяемо. Это ошибка.
Думайте об этом так:
Векторный индекс — это алгоритм. Он берет ваши векторы, организует их в структуру, которую можно искать (например, HNSW), и быстро находит похожие элементы. FAISS — хороший пример.
Но один алгоритм не справляется с хранением, фильтрацией или масштабированием. Он просто ищет.
Векторная база данных оборачивает этот индекс всем остальным, что вам нужно — распределенное хранилище, фильтрация метаданных, постоянство и одновременный доступ.
Она также дает вам гибкость в том, как вы индексируете. HNSW, IVF, DiskANN — разные техники для разных компромиссов между скоростью, точностью и памятью. Milvus — хороший пример.
Итак, одно — это компонент. Другое — это система.
Это различие кажется академическим, пока вы не столкнетесь с масштабом. Тогда это становится дорого.
Компания по автономному вождению узнала это на собственном опыте.
Они строили систему поиска для видеозаписей вождения — огромный масштаб. Каждая поездка генерирует кадры; каждый кадр становится векторным встраиванием.
Инженерам нужно было запрашивать сценарии, такие как "ночные городские перекрестки с пешеходами", по данным за месяцы.
FAISS был естественной отправной точкой. Быстрый, легкий, легко настраиваемый.
Но по мере роста данных встраивания каждого дня становились отдельными индексными файлами.
Через несколько месяцев: сотни тысяч изолированных файлов.
...
Топ
Рейтинг
Избранное
