AI大模型国产队又亮相一位新选手。5月6日,科大讯飞在安徽合肥召开发布会,正式发布讯飞星火认知大模型,并实时演示了大模型的七大核心能力,以及其在教育、办公、汽车、数字员工四大行业进行落地应用的探索成果。
发布会当天,一同公布的还有讯飞星火认知大模型具体赶超ChatGPT的时间。科大讯飞董事长刘庆峰透露,当前讯飞星火认知大模型在文本生成、知识问答、数学能力三大能力上已超ChatGPT,之后还将在年内进行三次升级,于10月底将整体赶超ChatGPT。
“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现‘智能涌现’”刘庆峰表示。
01七大核心能力公布,计划10月底整体赶超ChatGPT
不同于此前公布的多个大模型需要用户自己在对话框内输入文字指令的形式,科大讯飞在大模型现场演示环节玩出了一点新花样——基于其在智能语音方面的优势,讯飞星火认知大模型全程通过接收“语音输入”指令,并自动转写成文字的形式,完成了对七大核心能力的演示。
科大讯飞对外宣称的七大核心能力包括多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力,以及多模态输入和表达能力。
例如,在多风格多任务长文本生成能力方面,刘庆峰和科大讯飞研究院院长刘聪在现场直接语言输入“你为什么叫星火”、“请帮我写一篇欢迎词”等指令,指挥讯飞星火认知大模型迅速完成了文案创作、讲故事、写邮件、英文撰写品宣文案等文本生成工作。
这也是其他大模型的基础能力之一。据刘庆峰透露,在长文本生成上,讯飞星火大模型在国内已经明显领先,并且在中文方面超过了Chat GPT,并且在持续进步中。
在他看来,讯飞星火大模型同样超越了ChatGPT的还有数理能力和面向泛领域开放式知识问答的能力。其中,数理能力一定程度代表了一个大模型的聪明程度,泛领域开放式知识问答能力则代表着大模型具备很好的通识知识,能够对生活常识、科学知识、工作技巧,以及医学知识等应对自如。
例如在现场演示环节,当被问及一个较为复杂的计算题:“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么花坛里一共有多少朵牡丹花?”时,星火认知大模型很快算出答案为43朵。
大模型的逻辑推理能力也在现场得到了演示,当被问及“孔子在2008年的奥运会上说了些什么”时,星火认知大模型明确判断出,孔子在2008年的奥运会上没有说过任何话。当被要求“编一个孔子在2008年奥运会上给大家做汉语培训的故事”时,它则很快生成了一个故事。
而在多模态能力方面,根据演示,星火大模型还能根据关键词句生成语音、图片、视频,甚至生成虚拟人进行视频展示。
不过,刘庆峰也坦言,大模型技术目前还存在不少待攻克的缺陷,包括新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等问题。“这些问题在今年会有明显的改进。”刘庆峰表示。
他同时公布了星火认知大模型年内持续升级的三个关键里程碑节点:6月9日,星火大模型将突破开放式问答,多轮对话能力和数学能力再升级;8月15日,星火认知大模型将突破代码能力,多模态交互再升级;10月24日,星火认知大模型通用模型将直接对标ChatGPT,其中中文能力超越后者,英文能力与后者相当,并在教育、医疗等领域做到业界领先。
02大模型应用探索加速,已开始赋能四大行业
在公布大模型的同时,科大讯飞也介绍了其在行业应用方面的探索情况。这也是所有国产大模型的共同特点,他们需要第一时间考虑产业落地问题。
事实上,产业落地的问题是从一开始就被纳入考虑范围的。刘庆峰透露,星火认知大模型始于2022年12月15日,几乎是在ChatGPT发布半个月后,科大讯飞团队就启动了“1+N”大模型技术攻关。其中, “1”指的是通用认知智能大模型算法研发及高效训练方案底座平台, 而“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。
“对于人工智能来说,认知大模型成为通用人工智能的‘曙光’,它出现的历史意义不亚于PC或者互联网的诞生。”刘庆峰表示。
而在5月6日当天的发布会上,科大讯飞在“N”个领域中的一部分探索成果,也即教育、办公、汽车和数字员工四大行业的应用情况,也已经得到了展示。
比如,教育方向,通过“大模型+AI学习机”,可以让AI 像老师一样批改作文,像口语老师一样实景对话。根据现场演示,在作文批改上,搭载认知大模型的科大讯飞AI学习机T20系列可实现中英文作文类人批改,相比于传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改,讯飞AI学习机实现了围绕写作要求、分析全篇结构和文采的深度高阶批改。
而在办公方面,科大讯飞提出了“大模型+智能办公本”,以实现根据手写要点自动生成会议纪要,助力办公效能进一步提升。据悉,搭载大模型技术的讯飞智能办公本升级了会议纪要、语篇规整两大功能,可以有效解决口语稿阅读困难、纪要整理耗费精力、已有素材难成稿、长篇章难抓要点等痛点,让阅读效率提升50%。“大模型+讯飞听见”则可以将一段录音一键成稿, 一分钟输出流畅会议文案。
汽车方面,科大讯飞正在试图通过“大模型+智能座舱”,实现车内跨业务、跨场景人车自由交流。
而在数字员工方向,科大讯飞则希望通过“大模型+数字员工”,基于自然语言生成业务流程和 RPA,帮助企业员工完成大量重复性工作。例如,在现场演示环节,其就以公司招聘事项为例,输入指令后,系统即可自动按照事先设计的RPA脚本,操作计算机中的相应软件,实现业务流程的自动化操作并输出结果。
据透露,除了上述领域外,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,满足更多专业领域的需求,向更广阔的产业领域延伸。
“科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。”刘庆峰表示,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态,“与生态伙伴一起,燎原新一轮产业变革”。