现如今,人们只需敲敲键盘,就可以让AI写作工具帮忙代写论文、创作说唱歌曲或编写剧本。然而,根据《Science》的报道,一项新研究表明,这些AI作品至少在目前仍带有明显的衍生色彩。
为了验证这一观点,研究人员开发了一款能够衡量AI创造力的程序。伦敦大学学院研究AI创意性的计算机科学家Mirco Musolesi指出,评估创造力是“一个复杂且有趣的挑战”,并认为这一新方法在解决语言新颖性问题这一方面表现出色。
自生成式AI和大语言模型问世以来,科学界对其创作能力一直存在质疑。尽管这些AI可以快速生成看似人类创作的文字,但部分学者认为其并未真正创新,只是简单地重组训练语料中的内容。批评者将其比作“随机鹦鹉”。
然而量化这种创造力并非易事。科学家通常采取两种方法:一是用计算机检测抄袭迹象,但“无抄袭”不代表“原创性”;二是让人类评分评估流畅性和原创性,但这一过程主观且耗时。
对此,华盛顿大学的计算机科学家Lu Ximing和团队开发了一款名为DJ Search的工具。它既具备客观性,又能捕捉细微差异。该工具从AI输出文本中提取短语片段,并在数据库中查找相似内容。它不仅寻找完全匹配,还会识别语义相近的表达。借助AI算法分析词义,它通过嵌入向量判断同义词。最终,其通过计算未匹配部分在文本中的占比来评估AI输出的新颖性。
研究发现,人类在诗歌、小说和演讲领域的表现明显优于AI,分别高出80%、100%和150%。DJ Search还可以比较人类作品,例如《饥饿游戏》的语言原创性比《暮光之城》高35%。研究负责人Lu将AI类比为DJ:“它们像DJ混音音乐一样拼接文本,尽管精彩,却无法取代作曲家。”
加州大学洛杉矶分校的计算机科学家Nanyun Violet Peng建议,未来应评估整体叙事的原创性,而非仅限于语言层面。