我为什么避免图数据库 问题:"知识图谱 RAG 生产准备好了吗?我们应该使用它吗?" 答案:在机器学习领域工作了 10 年后,我远离图数据库。我见过的每个进入图世界的公司在 4-5 年内都回到了 SQL。 问题是真实的: 招聘人才困难(更容易找到 PostgreSQL 专家) 模式定义引发无休止的争论,没有明确的最佳实践 大多数用例只需要 1-2 次遍历,而不是复杂的图操作 甚至 Facebook 的 "图" 实际上是一个大型 MySQL 数据库。唯一真正需要图数据库的公司是 LinkedIn,用于 3-5 度的朋友关系计算。 即使是微软的文档图方法 - 我宁愿使用微调的嵌入。图只是一个邻接矩阵,微调可以让你接近那个相似性定义,而不需要操作复杂性。 从你的数据开始:让特定的用例证明图的复杂性,而不是先选择技术。图可能好 2%,但传统方法运作良好意味着这 2% 很少能证明维护成本的合理性。