DeepSeek-V3.1 就現(xiàn)已上線了其網(wǎng)頁 、比方 llama.cpp 就還不支撐 MTP。就因一個古怪的 Bug 引發(fā)社區(qū)熱議 :不管使命是寫代碼仍是收拾物理試卷,DeepSeek-V3.1 卻被發(fā)現(xiàn)存在一個適當(dāng)讓人無語的問題
:其某些輸出 token 會被隨機(jī)替換為「極」
。這個猜想的合理之處在于支撐 MTP 的 DeepSeek 官方 API 更不簡單遇到這種狀況,讓它剖析了一下或許的原因:

你遇到過這個問題嗎?覺得或許的原因是什么?
參閱鏈接
https://www.zhihu.com/question/1942934856603505597
https://www.reddit.com/r/LocalLLaMA/comments/1mzsg6v/deepseek_v31_getting_token_extreme_%E6%9E%81_%E6%A5%B5_out_of/?rdt=36282
本文來自微信大眾號“機(jī)器之心”,修改:Panda,大概率都是數(shù)據(jù)問題