喜马拉雅IPO：珠峰AI音频多模态大模型赋能，引领内容创作趋势- DoNews

在备受关注的2024云栖大会盛会上，喜马拉雅推出了其自主研发的“珠峰AI音频多模态大模型”，全面展示了该模型多样化的应用场景以及商业化实践案例。这款大模型以喜马拉雅超过百万小时的独家版权音频数据作为基础，经过深度学习与精细训练，不仅掌握了情感丰富的输出、自然流畅的表达能力，还实现了跨语种翻译与高速音频克隆等前沿技术，是音频生成领域的一次重大飞跃。

AI（人工智能）在深刻影响着我们的生活，也影响和改变着内容创作行业。作为在线音频头部企业，今年成立12年的喜马拉雅以科技赋能文化，围绕音频建立了一个丰富多元的“声音宇宙”，截至2023年12月底，喜马拉雅已经累积了包含459个品类的4.88亿条音频，总内容时长超过36亿分钟，能满足用户从-1岁到100岁不同年龄阶段的不同需求。

喜马拉雅从成立之初就十分重视技术投入，特别是布局AI，将AI技术突破作为平台发展和演变的主要驱动力，以便能在不断变化的数字环境中提高自身运营效率及满足用户需求。“珠峰AI音频多模态大模型”是喜马拉雅自主研发的AI音频生成大模型，依托其超百万小时的自有版权音频数据进行深度学习与训练，具备情感输出、自然表达、语种互译、极速克隆等技术能力，并在音频生成领域实现了多维度突破，正广泛应用于有声书等领域，未来将不断推动音频大模型行业的创新与发展。近日消息，喜马拉雅音频大模型已成功通过国家备案。

基于“珠峰AI音频多模态大模型”，喜马拉雅在云栖大会展示了“珠峰AI创作服务平台”，它依托通义文本大模型对文本内容语义的深度理解，结合喜马拉雅独有的全品类音色库和数字人大模型，为创作者提供高品质的AIGC音频和数智人服务。用户可以在“珠峰AI数智人平台互动体验区”体验AI为声音创作带来的便捷性，比如极速体验全领域多品类535种AI音色库生成全品类AIGC音频内容、15秒真人数智人形象快速定制、10秒声音极速克隆等。

最新数据显示，截至2023年底，喜马拉雅已拥有高达3.03亿的全场景平均月活跃用户，彰显了其庞大的用户基础与广泛的影响力。喜马拉雅平台上的AIGC内容已累积至惊人的2.4亿分钟，占据了总音频内容的6.6%，这一数据不仅反映了AIGC内容的快速增长，也预示着音频内容创作的新趋势。

声明：本站转载此文目的在于传递更多信息，并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容,本网站对此声明具有最终解释权。