Det blir klart at oppfinnsomhet og strategisk tilpasning kan overgå brute-force-skalering når det gjelder å fremme store språkmodeller. Hva mener jeg?  Vi kan øke ytelsen betydelig ved å fokusere på svært effektive modellarkitekturer (AI bruker mer tid på å resonnere individuelle spørsmål i stedet for omfattende opplæring) i stedet for å stole utelukkende på massiv datakraft og brikker.
9,93K