中文在线:公司有着海量的高质量正版内容和完整的各类型商业生态链 可大幅提升AI模型训练效果
有投资者在互动平台向中文在线(300364.SZ)询问公司如何利用其宠大的中文语料资源布局ChatGPT的竞赛。中文在线表示,AI模型的生产内容高度依赖源头数据,而公司深耕文化数字产业20余年,有4大优势:1. 公司拥有的中文文字字数超万亿字,内容品类包含科普类、社会类、经管类等等;2. 高质量,公司拥有的数字内容经过市场长期校验,已形成高质量的数据内容库,而高质量的数据可大幅提升模型训练效果,缩短学习时间和提升学习质量,让AI模型产出内容稳定;3. 正版版权,公司拥有旗下数字内容从数字版权到全部版权的权利,可为AI模型公司提供拥有版权的数据集用于训练;4. 公司拥有完整的各类型商业生态链,可实时反馈最新数据,提供最贴近市场和用户的最新数据,让AI模型持续更新学习。(格隆汇)
Copyright © DoNews 2000-2024 All Rights Reserved
蜀ICP备2024059877号-1     京ICP证151088号
京网文【2018】2361-237号