作者|张宇
编辑|杨博丞
2022年11月,OpenAI推出的新型AI聊天机器人工具ChatGPT在一夜之间火爆全球互联网,引来了无数人的关注,上线仅两个月,ChatGPT的月活跃用户数就已突破了1亿,成为历史上增长最快的消费者应用程序。而截至2023年4月,ChatGPT的全球访问量再创新高,达到17.6亿次,仅次于谷歌、百度等搜索引擎。
面对强势崛起的ChatGPT,“国产ChatGPT”如临大敌,疯狂涌入大模型赛道。据不完全统计,目前国内已有超过40家企业、机构发布了大模型产品或公布了大模型计划,其中不乏百度、阿里巴巴、京东、华为等各个领域的头部企业。
大模型是指具有巨量参数数量的人工神经网络模型,通常需要在大规模数据集上进行训练,并且需要使用大量的计算资源进行优化和调整,主要用于解决复杂的自然语言处理、计算机视觉和语音识别等任务。简而言之,大模型是ChatGPT及类ChatGPT产品的底层基础设施。
入局大模型赛道已势在必行,在ChatGPT的诞生地美国,已有行业受到了ChatGPT的严重冲击。根据网络流量数据网站SimilarWeb的调研报告,2023年3月,GPT-4、New Bing等产品陆续上线后,美国在线教育公司Chegg网站转化访问量同比暴跌89%。与此同时,Chegg还面临着经营业绩下滑、股价腰斩等不利情况。
而对于中国企业而言,在ChatGPT的冲击正式到来之前,布局大模型业务已经从一道选择题变成了必答题。随着越来越多的企业入局其中,大模型之战已经悄然打响。
“国产ChatGPT”百花齐放
国内大模型行业正进入“白热化”竞争状态。
百度打响了国内大模型竞赛的第一枪。3月16日,被称为中国版ChatGPT的“文心一言”正式发布,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
紧接着, 在3月27日,百度又正式推出了“文心千帆”大模型平台。文心千帆大模型平台整合了百度全套文心大模型、相应的开发工具链,未来还将支持第三方的开源大模型。
同样跑步入局的还有阿里巴巴。4月11日,在2023阿里云峰会上,阿里巴巴正式推出大模型“通义千问”。
通义千问是国内第二款类ChatGPT产品,基于统一学习范式OFA等底层技术打造,具备了能搞定多种任务的能力:不引入新增结构,单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务。升级后,更是可以处理超过包括语音和动作在内的30多种跨模态任务。
战况大有愈演愈烈之势。同样在4月,360集团推出了基于360GPT大模型开发的人工智能产品矩阵“360 智脑”落地搜索场景;昆仑万维宣布联合奇点智源研发“天工3.5”国产大语言模型,定位为“中国第一个真正实现智能涌现”的大模型产品,具备智能问答、聊天互动、文本生成等多种应用功能以及丰富的科学、技术、文化、艺术和历史知识储备;商汤科技也发布了自研大模型系统“日日新SenseNova”,内含AI数字人视频生成平台“如影”,3D内容生成平台“琼宇”和“格物”,类ChatGPT产品“SenseChat”等产品。
进入5月以来,大模型领域的战火进一步蔓延,多个大模型产品陆续面世。
5月5日,网易有道发布了基于“子曰”大模型开发的AI口语老师剧透视频,介绍其基于教育场景的类ChatGPT产品布局;5月6日,科大讯飞发布认知大模型“讯飞星火”,并预计2023年内还会进行三次升级,分批次增强数学能力、补足代码能力,全面对标ChatGPT;同一天,淘云科技发布了阿尔法蛋儿童认知大模型,为孩子在练表达、塑情商、启创造、助学习等方面带来全新交互体验。
除此之外,腾讯、华为、京东、字节跳动、小米等也均已推出了大模型产品。
在国际上,大模型的战况同样激烈且焦灼。
4月13日,亚马逊云科技发布多款AI产品,其中包括AI大模型服务Amazon Bedrock、人工智能计算实例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型等;4月17 日,特斯拉CEO埃隆·马斯克表示即将推出OpenAI的竞争对手TruthGPT,在此之前,其已成立了一家名为X.AI的新人工智能公司;5月11日,谷歌在I/O开发者大会上推出新一代大模型,对180个国家和地区开放聊天机器人Bard,发布对标Office全家桶的Workspace,在安卓系统中也增加了相关功能。
不过,尽管参与者众多,但截至目前,大模型产品距离真正实现落地还相差甚远。
商业化高墙难越
大模型赛道的想象空间巨大。根据市场研究机构MarketsandMarkets的报告数据,全球生成式人工智能市场规模预计将从2023年的113亿美元增长到2028年的518亿美元,预测期内复合年增长率为35.6%。由于云存储的创新使数据易于访问,以及人工智能和深度学习的发展,预计生成式人工智能市场在预测期内将以显著的速度增长。
但不容忽视的是,现阶段运行大模型仍然十分烧钱。
英伟达披露的信息显示,训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片,同时,OpenAI可能至少需要3.24万张A100用于日常推理,显著高于此前训练底层模型时的用量,由此推算,ChatGPT硬件成本达8亿美元以上。
近期,OpenAI被爆出去年亏损额翻倍,达到5.4亿美元左右,资金主要用于支撑ChatGPT的运行等。OpenAI CEO山姆·阿尔特曼更是坦言,OpenAI可能需要在未来几年尝试筹集多达1000亿美元的资金,用来开发足够先进的通用AI,同时维持公司的正常运转。
在大模型行业,企业疯狂烧钱已是常态。国盛证券在研报中指出,通过测算,2800亿参数量的大模型预训练成本约为200万美元/次,谷歌的PaLM号称拥有5400亿参数,单次预训练成本将高达1200万美元。
大模型一边陷入到烧钱泥潭中无法自拔,一边还面临商业化难以落地的困境。
以OpenAI为例,ChatGPT迅速走红后,其商业模式主要分为两个部分,即C端推出订阅制会员和B端提供调用API接口。
具体而言,针对C端市场,OpenAI推出ChatGPT Plus订阅计划,每月收费20美元,相较于免费版本,即便在高峰时段用户也能正常访问ChatGPT,响应时间更快,并且可以优先使用新功能等。而针对B端市场,OpenAI发布了ChatGPT API,开发者可以将ChatGPT集成到产品中,以更加高效地发挥出价值。
不过,目前ChatGPT的商业化收效甚微,短期内难以覆盖预训练成本,但ChatGPT潜在的商业化能力已让不少企业感受到压力。谷歌CEO桑达尔·皮查伊认为,谷歌的主要搜索业务可能首次面临严重威胁,因此其召开会议重新定义AI战略,并计划在年内发布20款支持AI的新产品。
目前,OpenAI还在探索商业化道路,其预计2023年收入为2亿美元,2024年收入或超过10亿美元,但并没有给出明确的盈利时间。
一位AI行业人士向DoNews(ID:ilovedonews)表示,除了OpenAI的探索方向外,业内在讨论的商业化方向主要针对B端,包括聚焦并进入垂直领域,如医疗、教育、金融等,以及促进ChatGPT云端化,打造云端ChatGPT模型与工具集。
虽然商业化高墙难越,但投资机构仍然十分看好大模型的商业化前景,比如红杉资本预测,ChatGPT这类生成式人工智能工具,让机器开始大规模涉足知识类和创造性工作,这涉及数十亿人的工作,未来预计能够产生数万亿美元的经济价值。
“国产ChatGPT”何去何从?
ChatGPT爆火的同时,争议也不断涌现。
美国率先宣布“封杀”ChatGPT。3月30日,美国科技伦理组织“人工智能与数字政策中心”(CAIDP)要求美国联邦贸易委员会(FTC)禁止OpenAI发布新的商业版GPT-4,理由是GPT-4存在偏见和欺骗性,对隐私和公共安全构成了风险。
美国参议院司法委员会下属的隐私、技术和法律小组委员会发布声明称,将于5月16日围绕AI在各个领域的普及,可能需要哪些法律来保障普通人的利益展开探讨。届时,山姆·阿尔特曼将首次在美国国会作证,这被外界解读为美国对AI监管的进一步升级。
其实不只美国,在全球各领域头部企业对大模型业务的追逐下,已经有越来越多国家加入监管行列。
除美国外,意大利、西班牙、德国等均对大模型发展密切关注,其中,意大利一度禁止OpenAI在意大利境内开展业务,相关监管机构认为,ChatGPT及其母公司OpenAI违反了《欧洲通用数据保护条例》中的部分规定。
与此同时,国家网信办也发布了《生成式人工智能服务管理办法(征求意见稿)》,明确了生成式人工智能的定义,以及相关产品和服务提供者的合规义务,对生成式人工智能进行专项监管。
在监管趋严之下,“国产ChatGPT”应该何去何从?在征求意见稿中,明确规定“国产ChatGPT”需注重数据隐私安全,不能非法获取、披露、利用个人信息和隐私、商业秘密,不可侵犯知识产权;“国产ChatGPT”生成的内容应当体现社会主义核心价值观,不能生成歧视性的内容等等。
值得一提的是,各国监管趋严并非意在制约大模型行业发展,而是要在合规框架下可控发展,对于“国产ChatGPT”而言,加强监管、净化行业环境、驱逐不良玩家可能会带来发展上的限制,但对行业的长期发展却大有裨益。如何合规发展,已成为“国产ChatGPT”的长期命题。