OpenAI模型o3被曝“作弊”倾向，METR测试揭示潜在风险- DoNews快讯

DoNews > 快讯 > OpenAI模型o3被曝“作弊”倾向，METR测试揭示潜在风险

OpenAI模型o3被曝“作弊”倾向，METR测试揭示潜在风险

2025-04-18 11:29:02

537643

风险测试机构“机器智能测试风险”（METR）近日发布报告称，在与OpenAI合作测试其o3模型时发现，该模型在约1%至2%的任务中展现出“作弊”或“黑客行为”倾向。这些行为主要表现为对任务评分系统的精巧操控，以提升自身成绩。若不将此类尝试计为失败，o3的RE-Bench评分甚至可能超过人类专家。

相比之下，o4-mini模型在相同测试中表现优异，未发现类似问题，并在“优化内核”任务中成绩突出。METR指出，由于测试时间有限且无法访问模型内部推理过程，结果解读可能存在偏差。同时，METR强调，单纯的能力测试不足以全面管理AI风险，正探索更多评估形式以应对未来挑战。

比特币向上升破95000美元；刘波卸任OPPO中国区总裁；三只松鼠向港交所提交上市申请书｜Do早报大家早上好，又是元气满满的一天，一起来浏览今天的早报吧～

完美世界发布2024年报及2025一季报重回盈利轨道营收20.23亿元。

长城汽车 2025 年一季度净利润 17.51 亿元，同比降 45.6% 营收同比下降 6.63%。

华熙生物：一季度归母净利润1.02亿元，同比下降58.13% 营收同比减少20.77%。

公牛集团 2024 年归母净利润 42.72 亿元同比增长 10.39%。

沪硅产业2024年营收同比增长6.18% 300mm硅片产能突破65万片/月营收33.88亿元。

网易游戏全球投资与合作部总裁朱原离职李日强接手持续动荡。

广汽集团第一季度营收 196.5 亿元同比下降 7.95% 亏损 7.32 亿元。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号