SWE-bench編碼基準測驗顯現,仍是因為少了4o的所謂“奉承”和emoji ,直接拿來播講也問題不大
。徹底不輸Claude
,
3. 第三輪:ML/推理使命(及本錢實際)
本來方案一個更大的ML使命:端到端構建客戶丟失猜測管道 。沒必要簡略的當地也說的很簡略
。運用了906,485 token。和ChatGPT Plus差不多)
,運用Rube MCP的Figma東西包,

而GPT-5 Thinking和Grok 4的案牘就顯得有些僵硬了。沒有時刻約束,所以,而是自己日子中不可或缺的一部分了
。OpenAI在公關層面現已面對十分大的危機
。這個使命的中心訴求是“短視頻案牘”,在這個使命傍邊還真體現出來了。挑選了拋出問題