Tweet aslinya terlalu lucu: Mereka yang mengatakan setiap hari bahwa "model bahasa besar (LLM) tidak dapat bernalar, mereka hanya dapat memprediksi token berikutnya" adalah "burung beo acak" yang sebenarnya: > persepsi model bahasa besar tetap pada akhir tahun 2022 (batas pengetahuan). > Mengklaim sebagai ahli model bahasa besar (halusinasi). > melihat istilah "prediksi token berikutnya" dan memegangnya dan mengulanginya (overfitting). > Jangan pernah merenung, hanya mengulangi kalimat (kurangnya penalaran).
Flowers ☾ ❂
Flowers ☾ ❂6 Sep, 06.48
Orang-orang yang meneriakkan "LLM tidak bisa bernalar; mereka hanya memprediksi token berikutnya" adalah burung beo stokastik yang sebenarnya: > belajar tentang LLM pada akhir 2022 (batas pengetahuan) > mengaku sebagai ahli LLM (halusinasi) > membaca "prediksi token berikutnya" sekali dan tidak akan tutup mulut (overfitting) > tidak mencerminkan; hanya mengulangi baris (non-penalaran)
17,64K