就因一個古怪的 Bug 引發社區熱議:不管使命是寫代碼仍是收拾物理試卷,

圖源:知乎 @琪洛
她猜想道:「置疑或許數據沒洗潔凈,DeepSeek-V3.1 卻被發現存在一個適當讓人無語的問題:其某些輸出 token 會被隨機替換為「極」。有時只占 1%,除了這 3 種「極」 token 在貪婪解碼中成為首選的狀況之外
,但多試幾回就能出來。即便從頭訓了 base 這個問題仍是留下了,并且當推理倉庫不支撐 MTP 時就會變得愈加顯著
,DeepSeek-V3.1 就現已上線了其網頁、并且運用 OpenRouter 的不同提供商都會呈現這個問題
,大概率都是數據問題 ,

圖源:知乎 @Fun10165
她表明 :「實測,
具體來說