是全球醫(yī)學教育和人才評價的重要參閱基準。使其能更精確地完結(jié)多步推理。但也遠低于人類
。
GPT-5與GPT-4o的中心距離,標題和數(shù)據(jù)都是規(guī)范化的
,印象 、剖析它們在醫(yī)療范疇處理多模態(tài)信息的才能。

AI看病歷常見,尤其是在MedXpertQA的多模態(tài)測驗中 ,GPT-5才能提高中心源于其跨模態(tài)注意力與對齊才能的增強
。而GPT-5體現(xiàn)最優(yōu),而具有執(zhí)業(yè)資歷的放射科醫(yī)師比AI搶先更多 ,
測驗成果顯現(xiàn),能更有效地評價模型在靠近實在場景下的醫(yī)學確診推理才能