”還有網(wǎng)友表明,這時就會呈現(xiàn)兩種狀況:大模型輸出“極”之后,陳述中說到,”notdba 表明,該開發(fā)者再次懇求官方解決問題。有開發(fā)者談?wù)摲Q,他表明這
可以說基本是預(yù)練習(xí)的問題。這個只能解釋為是 R1-Zero 強化學(xué)習(xí)之后得出的偶爾現(xiàn)象。
參閱鏈接:
https://github.com/deepseek-ai/DeepSeek-V3/issues/849
https://www.reddit.com/r/LocalLLaMA/comments/1mzsg6v/deepseek_v31_getting_token_extreme_%E6%9E%81_%E6%A5%B5_out_of/
https://www.xiaohongshu.com/discovery/item/68ac166a000000001d012571?source=webshare&xhsshare=pc_web&xsec_token=CBxtz16cD7hBeyge2T9Q3r5OWhHWYeqpxRhRb2uIoNKxk=&xsec_source=pc_share
https://www.zhihu.com/question/1942934856603505597
https://www.zhihu.com/people/qiao-shi-zhan-66/answers
本文來自微信大眾號“AI前哨”,只替換了“極”這個字。則官方 API 出問題概率下降