Vektorový index vs vektorová databáze, jasně vysvětleno! Většina lidí tyto pojmy používá zaměnitelně. To je chyba. Představte si to takto: Vektorový index je algoritmus. Vezme vaše vektory, uspořádá je do vyhledávatelné struktury (jako HNSW) a rychle najde podobné položky. FAISS je dobrým příkladem. Ale samotný algoritmus neřeší úložiště, filtrování ani škálování. Jen vyhledává. Vektorová databáze tento index zahrnuje se vším ostatním, co potřebujete – distribuovaným úložištěm, filtrováním metadat, perzistencí a souběžným přístupem. Také vám to dává flexibilitu v tom, jak indexujete. HNSW, IVF, DiskANN – různé techniky pro různé kompromisy mezi rychlostí, přesností a pamětí. Milvus je dobrý příklad. Takže jedna je součást. Druhá je systém. Tento rozdíl působí akademicky, dokud nedosáhnete měřítka. Pak to začne být drahé. Firma zabývající se autonomním řízením se to naučila na vlastní kůži. Budovali vyhledávací systém pro záznamy z jízdy – ve velkém měřítku. Každý trip generuje snímky; každý rámec se stává vektorovým vnořením. Inženýři museli dotazovat scénáře jako "noční městské křižovatky s chodci" napříč měsíci dat. FAISS byl přirozeným výchozím bodem. Rychlý, lehký, snadno se nastavuje. Ale jak data rostla, každý den se embeddingy staly samostatným indexovým souborem. O několik měsíců později: stovky tisíc izolovaných souborů. ...