Toán học thuần túy liên quan đến LLMs: Các token không liên quan (như "chó" và "mặt trời") nên tương ứng với các vector trực giao trong không gian nhúng. Vậy, trong ℝ^k, số lượng vector trực giao cặp tối đa là bao nhiêu? Còn nếu chúng chỉ "gần" trực giao, tức là ∣vi⋅vj∣<ε, ∀ i≠j thì sao?