看起来很熟悉!
CreativeMath
CreativeMath10月18日 04:59
与LLM相关的纯数学Q: 不相关的标记(如“狗”和“太阳”)在嵌入空间中应大致对应于正交向量。 那么,在ℝ^k中,成对正交向量的最大数量是多少?如果它们只是“近似”正交,即∣vi⋅vj∣<ε,∀ i≠j呢?
简而言之,
@boops_u(当然这是以点数的对数为基础) 所以如果它在基本维度上没有爆炸,那么你完全正确,这就是一个推论!
@boops_u 像是基空间维度的概率/误差是多少?在JL中,我们通常假设这是常数,因为点的数量很大(并询问投影空间如何变化)
@boops_u(我觉得这有点可疑,因为这个不平等确实很依赖于基础领域的维度,因为这正是让我们集中注意力的原因……所以我并不是100%确定!)
@boops_u(对于这个,我的“直觉”是一个好的基础在平均情况下会~抵消到零,所以它的范数也应该接近零)
45.42K