OpenAI部署新监控系统防范AI模型潜在风险- DoNews快讯

DoNews > 快讯 > OpenAI部署新监控系统防范AI模型潜在风险

OpenAI部署新监控系统防范AI模型潜在风险

2025-04-17 07:02:01

567388

人工智能公司OpenAI近期宣布推出一套“安全导向推理监控器”，专门用于监督其最新的人工智能推理模型o3和o4-mini。这套系统旨在防止这些高性能模型提供可能引发生物和化学威胁的有害建议。根据OpenAI的安全报告，o3和o4-mini在能力上较以往版本有显著提升，但也伴随着新的风险。尤其是o3模型，在回答制造生物威胁相关问题时表现尤为突出。

为降低风险，OpenAI通过红队成员耗时约1000小时，标记了与生物风险相关的对话内容，并测试了监控器的“阻断逻辑”。结果显示，模型拒绝回应风险提示的比例高达98.7%。然而，OpenAI承认，当前测试尚未涵盖用户尝试新提示词的情况，因此仍需人工监控作为补充。

尽管如此，部分研究人员对OpenAI的安全措施提出质疑，认为其在某些方面的投入不足，例如未发布GPT-4.1模型的安全报告。即便如此，OpenAI正逐步强化自动化系统，以更好地控制模型带来的潜在威胁。

DoNews汽车直击2025上海车展-奇瑞新QQ 上海车展2025。

DoNews汽车直击2025上海车展-极氪9X 2025上海车展。

DoNews汽车直击2025上海车展-大众ID.EVO 上海车展2025。

鹏翎股份2024年归母净利润增173.4%至7765万元营收24.6亿元。

一款诚意满满的旗舰手机，联想moto edge 60系列图赏国内正式发布定档在5月8日

性能续航双冠——真我GT7评测：重新定义手游玩家新体验越级体验。

搭载3nm天玑9400+，真我GT7正式发布，售价2599元起性能续航双冠王。

星纪魅族携手吉利汽车亮相上海车展，Flyme Auto 引领智能座舱新时代 2025 上海车展。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号