撰文:李昊原
昨天下午,阿里巴巴宣布开启语言大模型“通义千问”的企业邀测,正式加入大模型的竞赛中。不过对于这款产品,官方的介绍却很少,好在,DoNews第一时间拿到了内测邀请码,让“通义千问”亲自来解答了关于它的许多问题。
通义千问是来自阿里巴巴达摩院的大规模语言模型,主要功能是生成与给定词语相关的高质量文本,以帮助用户提高创造力和创新能力。名字的意思,是可以广泛回答不同领域复杂和独特的问题。
而在开始界面中,可以看到“写封邮件”“撰写短文”“电影脚本”“职场助理”四个选项。
我们挨个测验了下这四个功能,首先是写邮件,我们提出需求“帮我向部门主管发一封邮件,因为身体不适,下周一要请病假”。
作为对比,我们也让chatGPT回答了同一问题,不难看出,通义千问的回答更符合中国人的语言风格。
在职场助理选项中,我们询问“作为科技记者,我该如何报道人工智能的最新进展”,有趣的是,通义千问和chatGPT的回答出现了明显的差异。
通义千问的回答更倾向于去“具体做什么”,而chatGPT的回答则倾向于“先学习后工作”,也算是些许的思维差异了。
除了上述的四项功能外,通义千问还有“百宝箱”,里面有效率类、生活类和娱乐类的九个不同选项,可以在更细分的领域帮助使用者。
比如商品描述生成,这就很明显是针对电商卖家,以下是它对“天猫精灵”生成的描述:
生活类中,菜谱的选项比较实用,但小学生作文却有点让人摸不着头脑,难道是为了给小学生减负?
还有一个常见的选项,就是续写(然后呢),我们尝试让它续写了《了不起的盖茨比》的经典开头。
在我年纪还轻,阅历不深的时候,父亲曾给我一个忠告,我至今还念念不忘。 “每当你想要批评任何人的时候,”他告诉我:“要记住,世上不是每个人都有你这么好的条件。”
从结果来看,通义千问对原文的理解比较勉强,续写更是差强人意,“文学性”还有待进步。不过,娱乐类的三个选项,就显得人性化了许多。
我们尝试让它夸赞下“马云的长相”,以下是生成的结果,似乎……也不无道理?
在最后,我们询问了通义千问对其他大规模语言模型的了解,它知道BERT和GPT,但对自己却颇具信心,认为具有更优秀的性能和更丰富的应用场景。
也希望通义千问的信心,能在未来成为现实。