文 | 李信马
有人说过,看书就像是穿过时间和空间上的间隔,与作者对话,而现在,“对话”却从比喻变成了描述。
在掌阅科技的小程序“阅爱聊”上,笔者和“孔子”聊了聊他的学生,看过《论语》等书籍的朋友,从对话中应该可以勾起脑海中曾经文字的影子,但这样直接的对谈,却是非常有趣的体验。
对喜欢读电子书的朋友来说,掌阅科技并不陌生,这款能和书中人物对话的小程序,是一年前,掌阅科技以AI大模型为基础,自研推出的一款智能聊天式阅读平台。除了孔子外,还可以聊天的角色包括乔布斯、武则天、周公、唐僧等。
不过一家以阅读为主要业务的公司,为什么要推出AI对话的产品?不久前,DoNews参与采访了掌阅科技 CTO 孙凯,和他聊了聊,掌阅科技探索大模型在阅读场景应用的心得和经验。
在过去的十几年间,中国人的阅读习惯发生了多次迁移。首先是从纸质书向电子书迁移,2010年前后,电子书兴起,以数字形式存储,通过电脑、手机、电子阅读器等进行阅读。2015年之后,随着移动互联网的普及和智能设备的广泛应用,移动阅读成为主流,人们可以随时随地通过手机进行阅读,进一步提高了阅读的便利性和自由度。
不过,孙凯认为,过往的变革里,“其实还没有对阅读内容的可读性、体验以及可理解性,做比较触达本质的改造”。有统计数据显示,超过七成的人表示愿意读书,但最终坚持下来读书的人可能只有三成。
孙凯将影响用户阅读体验和继续阅读的问题,归纳到读前(选书难)、读中(读书枯燥)、读后(遗忘问题)三个场景中:
- 选书难:用户往往不知道看什么书,可能会从朋友推荐或社交媒体上获取信息,但开始读了发现对书并不感兴趣,导致一开始没选对书,就很难坚持阅读下去。
- 读书枯燥:用户选到了需要的书籍,如经济学的书籍,但这类书籍可能过于枯燥,需要极强的自律性才能读完,这也会导致用户难以坚持阅读。
- 遗忘问题:即使用户读完了书并认为对自己有帮助,但过后可能很快遗忘书中的内容,无法有效运用书中知识,这也会给用户带来负向的反馈,影响持续阅读的积极性。
而大模型技术,可能将开启阅读新的发展阶段。
在读前阶段,掌阅科技推出了“生成式推荐”,不再基于传统的用户点击或曝光行为信号,而是基于内容本身的理解,并结合用户行为的一些信号,来生成更贴近用户需求的推荐书籍,帮助用户更有效地选书,解决“瞎读书”的问题。
在读中阶段,首先将用户读书的目的分为两类,第一类是要提升自己,追求知识密度,追求认知上的提升还有知识的积累;第二类的需求是休闲娱乐、放松消遣。
对第一类用户,掌阅科技会帮助他们提高阅读的效率。“他是期望更少的时间获得更多的知识,追求效率,所谓效率就是一个分子分母,那么怎么做到用更少的时间来读完书呢?我们会对这本书整个的浏览过程做一个规划,正常来说这本书要读50个小时,规划完之后可能就只需要3个小时,坚持下来好像就没那么难了。那3个小时能不能获得跟50个小时一样多的知识?我们认为,带着问题去读收益最大。所以我们会有一些启发式的提问,帮助你提升单位时间内获取信息的效果。”孙凯解释道。
而对第二类用户,掌阅科技则通过图片、视频等多媒体形式,为用户提供了更具消遣性的娱乐体验,让用户能更沉浸式地消遣剧情。
在读后阶段,掌阅科技还会以书的相关知识点为核心,构建一张图帮助用户回顾,构建自己的知识网络,让围绕书的知识网络是相对清晰的、相对可回溯的。
这些功能的落地,离不开底层技术的支持。掌阅科技与亚马逊云科技从2015年开始合作,在生成式AI领域,掌阅科技使用了亚马逊云科技的机器学习平台 Amazon SageMaker 和 Stable Diffusion 亚马逊云科技插件解决方案,来提供文生图、文生视频等多维度阅读交互方式。
“模型训练需要不断迭代优化,传统机器学习开发是一个复杂、昂贵的迭代过程,而没有适用于机器学习工作流程的集成工具使得这一过程更加困难。Amazon SageMaker可以在单个工具集中提供用于机器学习的所有组件,使客户能够以更低的成本、更轻松地在更短的时间内将模型投入生产。” 亚马逊云科技大中华区解决方案开发中心总监徐海表示。
对于为什么与亚马逊云科技合作,孙凯进一步解释道:“其实对于我们来讲,我们如果要实际做一个文生图的项目,Stable Diffusion不管是资源管理、插件管理、伸缩性、稳定性、性能调优还是部署,都是我们技术上绕不过去的一个坎儿。我们确实有去尝试,找了一个显卡系统自己做了一次,发现其实并不顺利。这个设计上,我们认为需要的技术深度和广度还是不低的,正好我们就和亚马逊云科技的团队一起做了一次探讨和沟通,我认为把这部分更偏底层的技术交给靠谱的技术伙伴,我们做偏上层的一些场景化调优和围绕具体功能的一些调优,是性价比较高的一种方式。”