Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elie
> Dự án Suncatcher đang khám phá cách mà một ngày nào đó chúng ta có thể xây dựng các hệ thống tính toán ML có thể mở rộng trong không gian, tận dụng nhiều hơn sức mạnh của mặt trời
Có vẻ như diloco giữa các hành tinh không phải là một trò đùa sau tất cả 🚀

Sundar Pichai01:01 5 thg 11
Các TPU của chúng tôi đang hướng tới không gian!
Lấy cảm hứng từ lịch sử của chúng tôi về những cú nhảy vọt, từ điện toán lượng tử đến lái xe tự động, Dự án Suncatcher đang khám phá cách mà một ngày nào đó chúng tôi có thể xây dựng các hệ thống tính toán ML có thể mở rộng trong không gian, khai thác nhiều hơn sức mạnh của mặt trời (mà phát ra nhiều năng lượng hơn tổng sản lượng điện của nhân loại gấp 100 triệu lần).
Giống như bất kỳ cú nhảy vọt nào, điều này sẽ yêu cầu chúng tôi giải quyết rất nhiều thách thức kỹ thuật phức tạp. Nghiên cứu ban đầu cho thấy các TPU thế hệ Trillium của chúng tôi (các đơn vị xử lý tensor, được thiết kế riêng cho AI) đã sống sót mà không bị hư hại khi được thử nghiệm trong một máy gia tốc hạt để mô phỏng mức độ bức xạ của quỹ đạo thấp. Tuy nhiên, vẫn còn nhiều thách thức đáng kể như quản lý nhiệt và độ tin cậy của hệ thống trên quỹ đạo.
Cần thêm nhiều thử nghiệm và đột phá khi chúng tôi đếm ngược đến việc phóng hai vệ tinh nguyên mẫu với @planet vào đầu năm 2027, cột mốc tiếp theo trong nhiều cột mốc. Thật phấn khởi khi chúng tôi là một phần của tất cả những đổi mới đang diễn ra trong (không gian này)!

3,32K
Việc đào tạo các mô hình ngôn ngữ lớn (LLMs) từ đầu đến cuối là rất khó. Rất hào hứng để chia sẻ blog (sách?) mới của chúng tôi mà bao gồm toàn bộ quy trình: tiền đào tạo, sau đào tạo và hạ tầng. Hơn 200 trang về những gì đã hoạt động, những gì không, và cách để làm cho nó chạy một cách đáng tin cậy.

1,15M
> Việc xây dựng một mô hình nền tảng mới khó hơn nhiều so với việc tinh chỉnh một mô hình mở và tối ưu hóa suy diễn.
Thật kỳ lạ khi mà ít được thảo luận rằng hầu hết các startup (kể cả những startup được tài trợ tốt) không thể xây dựng các mô hình nền tảng của riêng họ và phải dựa vào các phòng thí nghiệm Trung Quốc tiên tiến mở mã nguồn của họ..

Nick30 thg 10, 2025
lý do mà cursor và windsurf phát hành các mô hình tối ưu hóa cho tốc độ là vì điều đó dễ thực hiện hơn nhiều so với việc xây dựng một mô hình nền tảng thúc đẩy trí tuệ
1. lấy qwen3 và tinh chỉnh nó qua RL trên dây đai của bạn
2. gắn nó vào phần cứng Cerebras (hoặc GPU tối ưu hóa)
3. để cho mô hình trung bình thông minh, siêu nhanh đó hoạt động
đối với các công ty đại lý lập trình, nếu bạn muốn mang lại giá trị cho thị trường, việc xây dựng một mô hình nền tảng mới khó hơn rất nhiều so với việc tinh chỉnh một mô hình mở và tối ưu hóa suy diễn.
thực tế, đó là cách hiệu quả để phát hành một cái gì đó gần với biên Pareto và tôi thích rằng các công ty đại lý lập trình đang bắt đầu tham gia.
nhưng đừng nhầm lẫn điều này với việc các công ty đại lý lập trình tuyên bố "trung bình thông minh nhưng nhanh > rất thông minh nhưng chậm"
48,68K
Hàng đầu
Thứ hạng
Yêu thích

