跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
DEX 功能
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
返回
自動翻譯代幣名稱
自動翻譯 X 內容
懸停顯示代幣卡片
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+2.2%
USELESS
-5.62%
IKUN
+19.09%
gib
+0.88%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-1.31%
ALON
+0.66%
LAUNCHCOIN
+14.78%
GOONC
+0.24%
KLED
-3.33%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.55%
Boopa
+13.01%
PORK
0.00%
主頁
Francesco Bertolotti
米蘭大學博士後研究員
查看原文
Francesco Bertolotti
2月10日 14:02
醒來時發現我一個新的 PR 被合併到 torchtitan。這修復了 bf16 的 torch trunc_normal_ 中的不穩定性,這在初始化時扭曲了權重,導致了大的激活和不穩定的訓練。
36
Francesco Bertolotti
2026年1月21日
有趣的論文使整個強化學習(RL)軌跡可微分,從而實現時間上的反向傳播。他們採樣了「軟令牌」,將其反饋到變壓器中,並對其應用可微分的獎勵。非常酷的工作! 🔗
17
Francesco Bertolotti
2026年1月6日
有趣的論文!它通過一個簡單的修正來處理LLM訓練中的logits發散:通過減去它們的均值來中心化輸出嵌入。理論是正確的,這是一個簡潔而優雅的解決方案! 🔗
17
熱門
排行
收藏