用相信度投票」?
這張圖展現了DeepConf在離線考慮時的中心機制:
它先判別哪些推理途徑值得信任
,再回頭去評價每條途徑的相信度 ,其量化方法為大都投票權重與總投票權重的比值
:

若β<τ,
按分數做一次相信度過濾,
在AIME 2025基準測驗中
,不只讓模型在世界頂尖數學比賽AIME 2025上拿下了高達99.9%的正確率 。陳述的數值為準確率(%) 。經過途徑的相信度分數
,僅僅咱們一向沒有仔細重視過他們的「考慮進程」。以便為在線決議計劃進程樹立間斷閾值s。推理途徑的生成將持續
。
在規范的大都投票中
,Ninit=16)。token耗費顯著更少。104
、以及均勻相信度的均值