wygląda znajomo !
CreativeMath
CreativeMath18 paź, 04:59
Czysta matematyka Q istotna dla LLM: Niepowiązane tokeny (jak "pies" i "słońce") powinny w przybliżeniu odpowiadać ortogonalnym wektorom w przestrzeni osadzeń. Więc, w ℝ^k, jaka jest maksymalna liczba par wektorów ortogonalnych? A co jeśli są tylko "prawie" ortogonalne, więc ∣vi⋅vj∣<ε, ∀ i≠j?
tl;dr,
@boops_u (chociaż oczywiście jest to logarytmiczne w odniesieniu do liczby punktów) więc jeśli nie wybuchnie w podstawowym wymiarze, to masz całkowitą rację i to jest wniosek!
@boops_u jaka jest prawdopodobieństwo/błąd w wymiarze przestrzeni bazowej? W JL zazwyczaj zakładamy, że jest to stałe, ponieważ liczba punktów jest duża (i pytamy, jak zmienia się przestrzeń projekcji)
@boops_u (to tylko trochę podejrzane, myślę, ponieważ ta nierówność w dużej mierze zależy od wymiarów pola podstawowego, ponieważ to właśnie to daje nam koncentrację w pierwszej kolejności… więc nie jestem w 100% pewny!)
@boops_u (w tym przypadku, moja „intuicja” podpowiada, że dobra baza ~ zrównoważy się do zera w średniej, więc jej norma powinna być podobnie bliska zeru)
66,93K