國(guó)際象棋文本排行榜
該排行榜依據(jù)一切參賽模型之間的循環(huán)賽成果
,保證評(píng)價(jià)的是實(shí)在的考慮進(jìn)程。Claude Sonnet-4、

天然,意味著模型在多進(jìn)程戰(zhàn)略問題解決方面達(dá)到了重要的里程碑,

數(shù)據(jù)集鏈接:https://www.kaggle.com/datasets/kaggle/chess-text-gameplay
國(guó)際象棋文本輸入基準(zhǔn)測(cè)驗(yàn)旨在評(píng)價(jià)和比較當(dāng)今通用言語模型的戰(zhàn)略推理才干。這個(gè)排行榜也有一些約束和缺點(diǎn):
(1)僅限于國(guó)際象棋