平台要价太高,OpenAI和Cohere等转向合成数据

DoNews7月20日消息,人工智能公司 Cohere 首席执行官 Aiden Gomez 近日透露,由于 Reddit、Twitter 等公司的数据采集要价太高,包括微软、OpenAI 和 Cohere 在内的 AI 公司,已使用合成数据来训练 AI 模型。

Gomez 表示合成数据可以适用于很多训练场景,只是目前尚未全面推广。

所谓的合成数据(synthetic data),是通过计算机技术人工生成的数据,而不是由真实事件产生的数据。但合成数据具备“可用性”,能够在数学上或统计学上反映原始数据的属性,因此可以作为原始数据的替代品来训练、测试并验证大模型。

标签: 合成数据
平台要价太高,OpenAI和Cohere等转向合成数据
扫描二维码查看原文
分享自DoNews
Copyright © DoNews 2000-2024 All Rights Reserved
蜀ICP备2024059877号-1     京ICP证151088号
京网文【2018】2361-237号