跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
DEX 功能
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
返回
自動翻譯代幣名稱
自動翻譯 X 內容
懸停顯示代幣卡片
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-11.41%
USELESS
+16.93%
IKUN
-5.3%
gib
-12.42%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-0.14%
ALON
-5.57%
LAUNCHCOIN
-7.8%
GOONC
-4.62%
KLED
-2.42%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-2.25%
Boopa
-5.62%
PORK
0.00%
主頁
Ahmad
人工智慧研究員和軟體工程師,肩負著建立 DGX B200 GPU 叢集的使命
查看原文
Ahmad
13 小時前
> GLM-5 是一個非常非常聰明且強大的模型,主要缺點是活躍參數的數量龐大,這使得它非常慢 > MiniMax-M2.5 由於其小巧、快速和智能,已成為我在本地運行的首選通用代理 > Kimi K2.5 仍然是最好的開源多模態
1
Ahmad
2月15日 14:45
MiniMax-M2.5 NVFP4 運行於 2x RTX 6000 > 單流每秒 83 個標記 > 允許最多 32 位同時用戶 > 推送超過 1000 個標記/秒 > 這大約花費 ~2x 512GB Mac Studios > 除了 Mac = 每次 1 個提示 > 而且每秒標記速度更慢 > 模型在 HF > lukealonso/MiniMax-M2.5-NVFP4
𝗭𝗲𝗻 𝗠𝗮𝗴𝗻𝗲𝘁𝘀
2月14日 14:45
非常興奮:第一個在 huggingface 上的 Minimax m2.5 NVFP4 量化。單流 vllm 在雙 RTX 6000 上達到 83tok/s。或者大約是價格只有一半的 Mac 512gb 系統的兩倍速度。除了 Mac 不能通過 32+ 的並發連接達到 1000+ tok/s。這次測試的每個 GPU 功率限制為 550W。 lukealonso/MiniMax-M2.5-NVFP4 我在圖片替代文字中使用的 vllm 食譜
46
Ahmad
2月14日 14:17
如果你現在正在做的事情沒有讓人感覺到「太大」、「太瘋狂」和「太荒謬」,那麼你就沒有看到未來的足夠遠。
17
熱門
排行
收藏