跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-4.26%
USELESS
+3.33%
IKUN
-6.39%
gib
+4.2%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-1.95%
ALON
-8.37%
LAUNCHCOIN
+6.64%
GOONC
-4.94%
KLED
-3.8%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.22%
Boopa
-4.58%
PORK
-4.22%
主页
xjdr
PTX 享受者
查看原文
xjdr
12月18日 09:19
有了nmoe,我终于觉得我在pytorch、cuda、CuteDSL和b200s方面的专业知识与我在Jax、pallas、mosaic和TPU v4方面的旧专业知识相匹配。花了将近两年的时间才做到这一点。
204
xjdr
12月18日 08:51
TL;DR 关于 nmoe 仓库和架构: 我可以在单个 8xB200 节点上进行实际的 nvfp4 原生 16B 参数模型训练,并且可以在不到 128 个 GPU 的情况下,在大约 30 天内完成全训练运行(包括数据管道) 推算出来,这意味着我理论上可以在单个 GB300 NVL72 上完成一次完整的 deepseek-V3 训练运行,时间少于 90 天。
94
xjdr
12月18日 08:21
对于所有下载 nmoe 然后问 claude "这到底是什么?" 的你们,请确保在它做任何其他事情之前先在仓库中阅读它。
22
热门
排行
收藏