GPT-4.1性能提升但难敌谷歌Gemini系列- DoNews快讯

DoNews > 快讯 > GPT-4.1性能提升但难敌谷歌Gemini系列

GPT-4.1性能提升但难敌谷歌Gemini系列

2025-04-16 08:31:01

187176

近日，OpenAI发布GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。新模型在编程能力上实现显著突破，例如在SWE-bench Verified测试中，GPT-4.1得分达54.6%，远超前代GPT-4o的21.4%。然而，与谷歌Gemini系列相比，GPT-4.1仍显不足。Stagehand发布的数据显示，Gemini 2.0 Flash错误率仅为6.67%，精确匹配率达90%，且成本低廉、速度更快，而GPT-4.1错误率高达16.67%，成本是Gemini的10倍以上。

此外，在编码专项测试中，Gemini 2.5以73%的得分领先GPT-4.1的52%。尽管如此，GPT-4.1作为非推理模型，其编码能力仍处于行业顶尖水平。哈佛大学科学家Pierre Bongrand的数据进一步表明，GPT-4.1在性价比方面不及Gemini及DeepSeek等竞品。

DoNews汽车直击2025上海车展-奇瑞新QQ 上海车展2025。

DoNews汽车直击2025上海车展-极氪9X 2025上海车展。

DoNews汽车直击2025上海车展-大众ID.EVO 上海车展2025。

鹏翎股份2024年归母净利润增173.4%至7765万元营收24.6亿元。

一款诚意满满的旗舰手机，联想moto edge 60系列图赏国内正式发布定档在5月8日

性能续航双冠——真我GT7评测：重新定义手游玩家新体验越级体验。

搭载3nm天玑9400+，真我GT7正式发布，售价2599元起性能续航双冠王。

星纪魅族携手吉利汽车亮相上海车展，Flyme Auto 引领智能座舱新时代 2025 上海车展。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号