腾讯云吴运声：打造大模型时代原生工具链，助力客户一站式构建AI原生应用- DoNews

5月17日，在腾讯云生成式AI产业应用峰会上，腾讯云副总裁、腾讯云智能负责人吴运声发表了题为《打造大模型时代原生工具链，助力客户低门槛、一站式打造AI原生应用》的主题演讲。

吴运声指出，随着大模型技术的快速发展，人工智能已成为企业数字化转型的核心动力。Gartner的调研显示，超过60%的中国企业计划在未来12至24个月内部署生成式AI，反映出企业对大模型技术的迫切需求。

面对企业在应用大模型技术时所需的降低使用门槛、提高平台适配性、保障安全合规等核心诉求。腾讯云正式推出大模型知识引擎、图像创作引擎、视频创作引擎三大工具，旨在通过PaaS接入方式，简化数据工程、模型精调、应用开发的流程，使企业能够更高效、简单地将大模型能力应用于生产、销售和服务等场景。

吴运声特别强调了大模型知识引擎在知识服务场景中的应用，该引擎基于大语言模型，解决了复杂文档解析、任务规划、行业适配等难题。通过应用模板简化创建流程，企业用户可以在5分钟内搭建出一款知识应用，并通过一站式流程快速验证、投产。此外，其还展示了大模型知识引擎在金融、教育、出行、零售等行业的落地案例，以及在腾讯内部知识管理领域的应用。

在图像和视频创作领域，腾讯云推出的图像创作引擎和视频创作引擎，基于自研混元模型，提供了文生图、图生图、视频转译、风格化等能力，大幅提高了创作与生产效率。

会上，腾讯混元大模型能力也持续升级，多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放，满足企业客户、开发者在不同场景下的模型需求，落地最优性价比模型方案。

吴运声表示，腾讯致力于开发更多专业、易用的工具，以降低大模型应用的门槛，让更多人能够享受到大模型技术带来的便利。他期待这些工具能够快速普及，为社会创造更大的价值。

以下为吴运声演讲全文：

尊敬的各位嘉宾、媒体朋友们，大家好！

我是腾讯吴运声，今天我分享的主题是《打造大模型时代原生工具链，助力客户低门槛、一站式打造AI原生应用》。过去一年，大模型产业快速发展，以大模型技术为核心，人工智能成为企业数字化发展的关键动力。前不久，Gartner发布一份调研显示，超过60%的中国企业计划在未来12至24个月内部署生成式AI。可以看到，企业对应用大模型技术的迫切感。

那么，如何将想法变为现实，帮助企业打破大模型技术落地障碍？在过去一年和广大客户的共创中，我们发现，要让企业用上大模型，用好大模型，还需要解决三大挑战。

第一，降低使用门槛。只有进一步降低工具使用门槛，减少对技术人才及专业技术能力依赖，让一线生产、经营人员也能“零门槛”用上大模型，才能加速生产经验与模型技术的融合，用技术为企业解决实际问题。

第二，提高平台适配性。未来，企业生产场景都将建基于AI 能力，企业的产品设计、运营流程、管理形式都可能围绕AI 重构。企业选择的大模型工具，既要能匹配、适应不断迭代的大模型技术，也需要满足不断扩大的场景需求，满足可持续的投入产出比。

第三，保障安全合规。生成式AI具有强大的归纳、生成、推理能力，但也面临全新的安全挑战。只有保障生成结果的安全、准确，才能满足企业对稳定性的需求，让企业管理者放心加大投入建设。

5分钟搭建企业级大模型应用

应对上述挑战，需要打造一套大模型时代的原生工具链。为此，我们今天正式发布大模型知识引擎、图像创作引擎、视频创作引擎三大工具，通过PaaS接入大模型，实现数据工程、模型精调、应用开发的流程简化，助力企业更高效、简单地将大模型能力应用于生产、销售和服务等场景。

首先，我们针对知识服务场景，推出大模型知识引擎。这是一款基于大语言模型的知识应用开发平台。他解决了知识服务场景常见的“复杂文档解析”、“复杂任务规划”、“专属行业适配”等难题。

在模型层，它集成了腾讯混元大模型、行业大模型等优势模型能力；在服务层，通过应用模板，简化创建流程。企业用户只需要输入模型选择、角色设定、知识库管理等基本信息，5分钟就可以搭建出一款知识应用。同时，我们还提供了测试-修正-发布-反馈增强的一站式流程，助力快速验证、快速投产，在客服营销、企业知识管理等业务场景落地。

只需三步，企业客户就用自然语言开发出一个知识应用。以API的形式，还可以快速地部署、集成到各类业务环境中，最大化放大企业知识价值和产出。在腾讯内部，与知识管理相关的客服场景，是我们最早投入的领域之一。基于大量产品实践，我们沉淀出大模型知识问答的核心能力，专注解决产业场景难题。

在问答效果上，知识引擎以RAG（检索增强生成）技术架构为基础，整合了OCR文档解析、向量检索、大语言模型、多模态大模型等多项技术。企业在上载专属知识库与行业专业文档后，会先通过向量数据库，生成大量问答。当用户提问时，系统先匹配相关文档片段，再由大模型基于提取内容来推理，这样会生成准确率远超通用大模型的回答，更好地满足to B场景对准确性的要求。

围绕问答交互，知识引擎集成了多模态大模型的能力，依托高分辨率色彩感知增强技术，支持图文混排、说明书、数据图标等复杂文档识别解析，答案生成，进一步提升用户体验。

针对复杂任务规划，目前业界主要基于agent的框架来做效果预研。但在实际情况中，业务的接口往往非常复杂，为了完成1个业务办理，需要调用多个API 。不同业务场景，调用的接口类型、调用顺序都有很大差别。大模型面临全新任务时，准确率是很低的，距离商用有较大差距。对此，我们采用了更落地的解决方案，由大模型话术自动生成、实体智能抽取、接口缺失追问等能力，结合传统工作流，简化业务流程配置，降低配置成本。

三大AI大模型引擎的多行业、多场景应用

目前，腾讯云大模型知识引擎已在政务、金融、教育、出行、零售等多个行业落地。在金融行业，圆心惠保开发了保险代理人高效惠民智囊，通过大模型技术辅助，自动生成产品知识问答和安抚话术，实现人均提效50%。浙江万榕，用大模型知识引擎打造出在线知识服务平台“榕博士”，实现技术人员提效50%。

在教育行业，河南省数字教育发展有限公司，用大模型知识引擎进行知识梳理配置，导入河南省百万级的中小学教材文档导入，打造出7×24小时在线的教师助理及学生助手。这项应用目前已在郑州、洛阳、许昌的重点中小学上线。

除了与外部客户共建，我们也基于知识引擎升级了多款腾讯应用。我们刚刚提到，用大模型知识引擎可以更好地处理“复杂任务规划”。这个能力已被应用于企点客服大模型文本机器人。在面向账单查询、退换货这类复杂任务时，大模型机器人配置成本，相较传统文本机器人减少50%。

在交互层面，数智人能够更好地理解和处理自然语言，准确识别用户意图，提供更为精准的回答和建议；借助知识引擎“大脑”，数智人将拥有更丰富的知识储备，为用户提供更专业的解答、更个性化的服务。

今年，我们为云南电视台打造3D卡通代言人小彩云，结合大模型知识引擎，小彩云升级为智能助手，针对云南文化、服务、美食等信息，为用户提供个性化交互问答服务。

我们还通过大模型，持续提升数字人的生产效能。在电商场景，小样本数智人支持一键换装，实现快速、批量化商品动态更新；在短视频场景中，真人实景拍摄生成数字人，具有更自然、丰富的表情和肢体语言；面对蓬勃发展的出海业务，数字人通过多语种样本训练，批量化生成多语言播报视频，让海外传播更便捷。

腾讯乐享是服务于企业内部的知识学习协作平台，为企业提供知识管理、学习培训文化建设等服务，目前已经服务了超过30万家客户，用户超过1亿。

在结合腾讯自研大模型和知识引擎后，实现了两大场景的关键革新。围绕“知识生产”，乐享结合大模型知识引擎，为用户升级“智能写作”等能力，可以实现写作前提供思路，写作中辅助润色，写作后辅助修缮，助力企业员工提升创作效率和质量。

围绕“知识问答”，大模型知识引擎解决信息获取链路长、内容利用率低、权限分配不清晰等难题。在常见的文档权限场景，一个拥有薪酬权限的员工提问“员工薪酬怎么算”会获取详细回答，一个没有权限的员工问同一个问题，AI则会回答“抱歉，不清楚”。

湖南旷真律师事务所，将4万多份员工编撰的内部知识文档导入腾讯乐享，构建出专属AI知识库，实现AI智能问答。

针对图像、视频素材生成场景，我们带来了“图像创作引擎”、“视频创作引擎”两款大模型PaaS工具。图像创作引擎，基于腾讯混元的自研图像创作底层模型，具备业界领先的文生图、图生图能力，为企业客户提供AI写真、线稿生图等图像创作能力。

今年，我们通过算法升级，进一步提高了文生图效能，画面风格扩充至18种。同时，增加了提示词自动扩写功能，在输入提示词后，系统可以通过自动扩充、补充细节，丰富画面元素，进一步简化创作流程。

针对商用场景，推出“线稿生图”的能力，用户只需要上传产品设计线稿，通过提示词和参数设定，可以快速将简单的设计线稿变为精美的实物图片，大幅缩短创作与生产周期。未来，在产品营销环节，我们还可以基于背景生成技术，快速、批量产出营销素材，大大提高生产效率。

针对视频创作，我们的“视频创作引擎”，基于多模态算法技术，实现了视频转译、视频风格化、画布拓展等多种功能，助力企业客户快速、高性价比输出各类视频内容，用于不同群体、不同平台的广告投放。

今年3月，我们与《人民日报》，用大模型共创《江山如此多娇》视频，引发大量关注和强烈反响。在这个视频中，我们综合使用了图生视频、视频风格化、视频插帧、艺术字视频等多项视频创作能力，100%依托大模型能力进行创作。

通过图生视频的能力，我们上传一张风景图片，输入提示词“倒影逐渐放大”和相关参数配置，1秒即可生成对应视频；通过视频风格化，选择2D动漫，湖面元素即可实现浮动展现；在这里，我们还采用了视频插帧功能，通过上传多张图片，自动计算图片之间的画面，最终输出一段连贯的创意视频；艺术字视频功能，给艺术字图片输入提示词和参数选择后，即可生成对应内容。

大模型知识引擎、图像创作引擎、视频创作引擎的技术原理有两个特点，一个是功能强大，覆盖了数据处理、模型精调、应用接入等多个流程，二是操作简单，“模板化”的产品结构，通过自然语言交互，即可完成应用开发，即使是不懂技术的生产、经营人员，也能发挥创造性，用大模型提升工作效率，改造生产流程。

多款智能应用升级与行业落地实践

除此之外，我们还带来多款“开箱即用”的产品应用，他们基于大模型技术提升生产效能，在不同场景实现提质增效。在智能座舱场景，基于混元大模型，车载语音助手完成智能化升级，可以理解、回复复杂提问，响应完成高阶任务，全面提升车主体验，从而帮助车厂、伙伴构建大模型时代的竞争力。

在输入层，把感知用户状态的各种信号源，用户画像特征导入大模型进行训练，大模型会对车主偏好有更深入的理解。同时，大模型通过agent调用各种API接口，让车载语音助手化身执行任务的小帮手，完成车主在行程中的需求。

在应用层，大模型赋能座舱场景，实现三大升级。首先，口语化理解能力提升，与传统对话可以实现无缝切换；其次，应用能力升级，可以实现行程规划，也可以完成车辆知识问答，遇到故障还会主动报告并给出解决方案；第三是交互能力升级，车主可以随时与大模型进行闲聊，还可以进行AI绘画创作。

在营销提效的场景，我们推出“企点营销云AI助手”，为企业客户提供专业、高效、易用、可信的智能分析和营销服务。通过对话式数据分析、智能归因、结论提取及报告生成、异常诊断及预警四大智能分析服务，客户可以实现“轻松提问，秒获洞察”的全新体验。

目前，AI助手已经在零售、出行、泛互、泛政多个行业落地，与10多家客户推进合作共创。但我们也在过程中，发现了两大挑战，并对此进行了能力升级。针对复杂分析问题理解，例如同一提问包含多个问题，我们优化了模型问题拆解和任务编排能力，升级后可覆盖90%以上复杂分析场景，问题整体识别率提升至88%以上。

针对专业领域知识理解，例如“流量”在交通行业特指“车辆ID计数”，在零售行业又被定义为“用户ID计数”，我们采用知识融合外挂方案，一方面通过高质量数据构建行业通用知识，另一方面通过客户特有知识输入，提高准确度，实现分析最优解。

我们为一家品牌零售商客户，提供了营销云以及AI助手的服，实现门店经营管理快速提效。过去，各层级的销售主管，一线门店店长，往往会面对分析能力短缺、分析需求回应慢等挑战，无法及时通过数据定位经营问题。通过AI助手，现在他们可以随时随地提问，高效获取精准的数据洞察，帮助下一步决策动作。

企点营销云还在持续通过大模型，升级服务能力。未来AI助手在内容生成、对话式人群生成、营销策略生成等智能营销应用上，还会持续推出新功能，敬请期待！

在代码提效场景，我们推出腾讯云AI代码助手，针对代码补全，技术对话，单元测试和代码诊断4个环节进行重点升级。其中，在代码对话、单元测试场景，基于大模型进行指令对齐和强化学习；在私有化补齐场景，进行专业模型训练和推理优化。

在与行业客户共建的过程中，我们挖掘出代码开发的四类共性挑战，包括代码训练挑战、代码评测挑战、IDE插件开发工具版本多，兼容难，细节打磨成本高；以及专业开发人员对产品的高要求。

目前，通过集团内外的大规模实践与打磨，腾讯云AI代码助手的代码生成率达到30%，实现编码时间缩短40%，研发提效20%。在腾讯内部，50%开发人员都在使用AI代码助手编代码。未来，我们也期待与更多企业客户共创，打造更优的研发体验。

以上，就是我为大家带来的大模型工具、产品进展。作为一家科技公司，我们的责任是开发出更多专业、易用的工具，降低大模型应用门槛，让更多人能用得起、用得好大模型。我们真诚地希望，这些工具能为大家所用，让大模型技术以更快的速度普及，为我们的生活创造更大价值。