Đoạn này trên Twitter thật sự rất buồn cười: Những người ngày nào cũng lặp đi lặp lại rằng "mô hình ngôn ngữ lớn (LLM) không thể suy luận, chỉ có thể dự đoán từ tiếp theo (Token)" mới thực sự là "vẹt ngẫu nhiên": > Nhận thức về mô hình ngôn ngữ lớn dừng lại ở cuối năm 2022 (thời điểm cắt đứt kiến thức (knowledge cutoff)). > Tự xưng là chuyên gia về mô hình ngôn ngữ lớn (ảo giác (hallucination)). > Thấy cụm từ "dự đoán từ tiếp theo (next-token prediction)" là không buông tha, lặp đi lặp lại (quá khớp (overfitting)). > Không bao giờ tự phản ánh, chỉ biết nhắc lại câu này (thiếu khả năng suy luận (non-reasoning)).
Flowers ☾ ❂
Flowers ☾ ❂06:48 6 thg 9
Những người hô "LLMs không thể lý luận; chúng chỉ dự đoán token tiếp theo" mới là những con vẹt ngẫu nhiên thực sự: > đã tìm hiểu về LLMs vào cuối năm 2022 (điểm cắt kiến thức) > tuyên bố là chuyên gia LLM (ảo tưởng) > đã đọc "dự đoán token tiếp theo" một lần và không ngừng nói (quá khớp) > không phản ánh; chỉ lặp lại câu nói (không lý luận)
17,98K