向量索引與向量資料庫,清楚解釋! 大多數人將這些術語互換使用。這是一個錯誤。 這樣想: 向量索引是一種算法。它將你的向量組織成可搜尋的結構(如 HNSW),並快速找到相似項目。FAISS 是一個很好的例子。 但僅僅有一個算法並不能處理存儲、過濾或擴展。它只是進行搜尋。 向量資料庫將該索引與你所需的其他所有內容包裝在一起 - 分散式存儲、元數據過濾、持久性和並發訪問。 它還為你提供了索引的靈活性。HNSW、IVF、DiskANN - 不同的技術在速度、準確性和記憶體之間有不同的權衡。Milvus 是一個很好的例子。 所以,一個是組件。另一個是系統。 這種區別在你達到擴展時感覺學術化。然後它變得昂貴。 一家自駕車公司深刻體會到了這一點。 他們正在為駕駛影像建立一個搜尋系統 - 大規模。每次行程生成幀;每個幀成為一個向量嵌入。 工程師需要查詢像 "夜間城市交叉口有行人" 的場景,跨越數月的數據。 FAISS 是自然的起點。快速、輕量、易於設置。 但隨著數據的增長,每天的嵌入變成了單獨的索引文件。 幾個月後:數十萬個孤立的文件。 ...