亚洲_se图 在线推理本钱骤降75%。gpt-oss用新数据类型完成4倍推理速度,80GB显卡能跑1200亿参数大模型-6488avav發布時間:2025-11-10 11:06:29分類: 最新新聞例如 ,事實上,MXFP4在把內存占用降為同規劃BF16模型的四分之一的一起