OpenAI新模型幻觉问题加剧，准确性面临挑战- DoNews快讯

DoNews > 快讯 > OpenAI新模型幻觉问题加剧，准确性面临挑战

OpenAI新模型幻觉问题加剧，准确性面临挑战

2025-04-19 07:50:02

216884

OpenAI近期发布的o3和o4-mini模型在编程与数学等领域表现突出，但其“幻觉”问题却显著恶化。据外媒TechCrunch报道，这两款推理模型的幻觉频率不仅超过前代o1、o1-mini和o3-mini，甚至高于传统非推理模型。内部测试显示，o3在PersonQA基准测试中的幻觉率高达33%，而o4-mini更达48%。相比之下，前代模型o1和o3-mini的幻觉率分别为16%和14.8%。

这一反常现象表明，随着模型规模扩大，幻觉问题反而更加严重。Transluce实验室的测试发现，o3曾虚构出在MacBook Pro上运行代码的操作，尽管其并无此能力。OpenAI发言人Niko Felix承认，解决幻觉问题是当前研究的重点，公司正努力提升模型的准确性和可靠性。然而，这一挑战仍需进一步探索与突破。

曹操出行更新招股书：2024年营收高速增长，市场规模跃升行业第二业务覆盖136城。

突破技术瓶颈移动互联网未成年人模式正式发布全方位升级。

Canalys：今年Q1全球智能手机市场微涨0.2%，多个区域市场陷入下跌难。

传小红书商业技术负责人苍响离职或因方向分歧待证实。

小米SU7被恶意视频拼接，深圳新闻网回应已下架。

方盒子变长方盒子？捷途旅行者加长版！方盒子变长方盒子？捷途旅行者加长版！

连续两年业绩下滑后，联想控股高管集体涨薪，董事长宁旻涨薪117.9万元没道理。

重量约507g 佳能发布远摄变焦镜头RF75-300mm F4-5.6 携带方便。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号