斯坦福团队被曝抄袭清华系大模型,已删库跑路

斯坦福 AI 团队发布的新模型 Llama3-V 被指抄袭中国国产大模型 MiniCPM-Llama3-V 2.5,包括模型结构、代码和配置文件,仅变量名有所改变。证据包括直接代码对比、分词器使用和实验性特征行为的高度相似性。

Llama3-V 作者最初声称参考了 LLaVA-UHD 架构,并在面对质疑时删除了相关项目及回应。网友发现 Llama3-V 的 checkpoint 可以在 MiniCPM-Llama3-V 2.5 的代码上运行,且两者在未公开的实验性数据上表现极为相似。

尽管有部分网友认为两者间存在借鉴关系,但普遍观点认为斯坦福团队的行为超出了借鉴的范畴。目前,斯坦福团队已下架相关项目并删除回应,面壁智能 CEO 李大海也做出了正式回应。

Copyright © DoNews 2000-2024 All Rights Reserved
蜀ICP备2024059877号-1     京ICP证151088号
京网文【2018】2361-237号