выглядит знакомо!
CreativeMath
CreativeMath18 окт., 04:59
Чистая математика Q, относящаяся к LLM: Несвязанные токены (такие как "собака" и "солнце") должны примерно соответствовать ортогональным векторам в пространстве встраивания. Итак, в ℝ^k, каково максимальное количество попарно ортогональных векторов? А что, если они только "почти" ортогональны, так что ∣vi⋅vj∣<ε, ∀ i≠j?
короче говоря,
@boops_u (хотя, конечно, это логарифмически по количеству точек) так что, если это не взорвется в базовом измерении, то ты совершенно прав, и это следствие!
@boops_u какова вероятность/ошибка в размерности базового пространства? В JL мы обычно предполагаем, что это постоянно, так как количество точек велико (и спрашиваем, как варьируется пространство проекции)
@boops_u (это просто немного подозрительно, я думаю, поскольку это неравенство очень зависит от размеров базового поля, потому что именно это приводит к концентрации в первую очередь... так что я не на 100% уверен!)
@boops_u (в этом случае, моя "интуиция" подсказывает, что хорошая основа в среднем ~ будет стремиться к нулю, так что её норма также должна быть близка к нулю)
67,81K