Menjadi jelas bahwa akal dan adaptasi strategis dapat melampaui penskalaan brute-force dalam memajukan model bahasa besar. Apa maksud saya?  Kami dapat meningkatkan kinerja secara signifikan dengan berfokus pada arsitektur model yang sangat efisien (AI menghabiskan lebih banyak waktu untuk menalar kueri individu daripada pelatihan ekstensif) daripada hanya mengandalkan daya komputasi dan chip yang sangat besar.
10,37K