最新一期《Cureus》杂志刊登了一项经过严格同行评审的研究,该研究揭示了OpenAI的GPT-4语言模型在未经特定训练的情况下,成功通过了日本国家物理治疗考试的门槛。

在这项研究中,研究团队向GPT-4提出了涵盖记忆、理解、应用、分析及评估等多个维度的1000道考题。结果显示,GPT-4以73.4%的总体正确率通过了全部五个考核部分,展现了其广泛的知识覆盖和解题能力。然而,研究也深刻揭示了AI在某些具体情境下的局限性。

AI震撼医疗界!GPT-4在日本物理治疗师考试中大放异彩,展现卓越解题能力

GPT-4在回答一般性理论问题时游刃有余,正确率高达80.1%,但在涉及实际操作或应用的问题上,其正确率则显著下降至46.6%。此外,在纯文本问题处理上,GPT-4展现出了80.5%的高准确率,而一旦问题中融入了图片和表格等多媒体元素,其表现便大幅下滑至35.4%,这一发现与先前关于GPT-4在视觉理解方面存在局限的研究结果相吻合。

值得注意的是,无论是问题的难易程度还是文本的长度,均未对GPT-4的性能造成显著影响。尤为引人注目的是,尽管GPT-4主要基于英语数据进行训练,但在处理日语考题时,其表现同样令人瞩目,这进一步证明了其跨语言理解和应用的能力。

AI震撼医疗界!GPT-4在日本物理治疗师考试中大放异彩,展现卓越解题能力

尽管研究展现了GPT-4在临床康复教育和医学领域应用的巨大潜力,但研究人员仍持谨慎态度,指出GPT-4并非无所不能,未来仍需对新版本模型及其在不同测试环境下的表现进行更全面的评估。

AI震撼医疗界!GPT-4在日本物理治疗师考试中大放异彩,展现卓越解题能力

同时,研究人员还展望了多模态模型如GPT-4v在提升视觉理解方面可能带来的突破。当前,包括谷歌的Med-PaLM2、Med-Gemini以及Meta基于Llama3的医疗模型在内的众多专业医疗AI正加速研发,旨在超越通用模型在医疗任务中的表现。然而,专家们普遍认为,要实现医疗AI模型的广泛应用仍面临诸多挑战,包括减小模型在医疗环境中的误差空间、显著提升其推理能力等,这些都是将AI安全、有效地整合到日常医疗实践中的关键所在。