黑人gay推理本钱骤降75%。gpt-oss用新数据类型完成4倍推理速度,80GB显卡能跑1200亿参数大模型-6488avav發布時間:2025-11-10 20:43:54分類: 最新新聞OpenAI在最新的開源模型gpt-oss上選用的MXFP4數據類型,英偉達推出了自己的微縮放數據類型NVFP4,它只能標明8個正數和8個負數 。然后進步推理速度。降到FP4(Nvidia Blackwell 芯片供給硬件加速)后,MXFP4經過將一組高精度數值(默許32個)乘以一個公共縮放因子(這個縮放因子是一個8位二進制指數) 。在大言語模型場景下簡直沒有質量丟失 ,就能進步到9petaFLOPS。數據讀寫速度和容量的約束。丟失的程度取決于詳細的量化辦法。OpenAI只運用了MXFP4