大阪都会大学医学研究生院的研究团队近期发布了一项系统性回顾和荟萃分析,评估生成式人工智能在医疗诊断中的表现。研究筛选了18371项相关研究,最终对83项进行深入分析,涉及GPT-4、Llama3 70B等多款AI模型。结果显示,这些模型的平均诊断准确率为52.1%,部分模型的表现与非专家医生相当,但专家医生的准确率仍高出15.8%。
研究还发现,AI在皮肤科表现突出,但在泌尿科的数据有限。Hirotaka Takita博士指出,生成式AI可辅助医学教育和资源匮乏地区的诊断,但其透明度和潜在偏见仍是重要议题。未来需进一步验证AI在复杂临床场景中的应用价值,以推动更安全、高效的医疗技术发展。