Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Một mô hình mã nguồn mở SOTA khác 👍
Với 355B tham số (32B MoE hoạt động), nó nhỏ hơn một chút so với một số mô hình ~1T mà chúng ta đã thấy.
Theo như tôi biết, họ không nói rõ phần cứng nào đã được sử dụng để đào tạo mô hình này, nhưng họ đã sử dụng 23T token đào tạo.
Nếu tôi hiểu đúng, cả Alibaba và Tencent đều là nhà đầu tư trong một startup ở Bắc Kinh.

11:43 11 thg 8
Giới thiệu báo cáo kỹ thuật GLM-4.5!👇
Công trình này chứng minh cách chúng tôi phát triển các mô hình xuất sắc trong việc suy luận, lập trình và thực hiện các nhiệm vụ tự động thông qua một phương pháp đào tạo đa giai đoạn độc đáo.
Các đổi mới chính bao gồm việc lặp lại mô hình chuyên gia với tự chưng để thống nhất khả năng, chế độ suy luận lai cho việc giải quyết vấn đề linh hoạt, và chương trình học tăng cường dựa trên độ khó.

7K
Hàng đầu
Thứ hạng
Yêu thích