跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
DEX 功能
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
返回
自动翻译代币名称
自动翻译 X 内容
悬停显示代币卡片
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-7.61%
USELESS
+15.47%
IKUN
+2.77%
gib
-3.95%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-2%
ALON
+2.26%
LAUNCHCOIN
+12%
GOONC
-2.33%
KLED
-3.3%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+1.14%
Boopa
+29.87%
PORK
0.00%
主页
Ahmad
人工智能研究员和软件工程师,肩负构建 DGX B200 GPU 集群的使命
查看原文
Ahmad
21 小时前
苹果的心理战游戏无敌 他们在 M5 发布之前清理旧库存,使用这个 ClawdBot / Moltbot / OpenClaw 东西 4D 国际象棋
7
Ahmad
2月16日 10:18
> GLM-5 是一个非常非常聪明且强大的模型,主要缺点是活跃参数的数量庞大,使其运行非常缓慢 > MiniMax-M2.5 由于其小巧、快速和智能,已成为我本地运行的首选通用代理 > Kimi K2.5 仍然是最好的开源多模态模型
10
Ahmad
2月15日 14:45
MiniMax-M2.5 NVFP4 运行在 2x RTX 6000 > 单流 83 个令牌/秒 > 允许最多 32 个并发用户 > 推送 1000+ 个令牌/秒 > 这大约花费 ~2x 512GB Mac Studios > 除了 Mac = 一次一个提示 > 甚至更慢的令牌/秒 > 模型在 HF > lukealonso/MiniMax-M2.5-NVFP4
𝗭𝗲𝗻 𝗠𝗮𝗴𝗻𝗲𝘁𝘀
2月14日 14:45
非常兴奋:首个 Minimax m2.5 NVFP4 量化模型在 huggingface 上发布。单流 vllm 在双 RTX 6000 上达到 83tok/s。或者说速度是价格仅为一半的 Mac 512gb 系统的两倍。除了 Mac 不能通过 32+ 并发连接实现 1000+ tok/s 的速度。此测试的每个 GPU 功率限制为 550W。 lukealonso/MiniMax-M2.5-NVFP4 我在图像替代文本中使用的 vllm 配方
55
热门
排行
收藏