腾讯云李力:构建稳定安全的基础设施,助力大模型应用落地

在2025腾讯全球数字生态大会成都峰会上,腾讯云副总裁李力表示,腾讯云用云原生、同源同构、场景驱动的智算平台,帮助产业突破算力瓶颈,助力产业加速释放AI生产力。腾讯云构建了业界唯一的全球统一基础设施,其高并发、柔性、可扩展等基础特性,在AI时代形成独特的价值优势;基于腾讯云原生的最佳实践,无论是公有云、混合云还是专有云,AI都可以享受和云一致的能力和稳定性。

目前,腾讯云智算已为90%以上的国内头部大模型企业提供服务,在互联网企业、大模型厂商、金融行业、政企行业、AI开发等多个场景逐步深度应用。

腾讯云副总裁 李力

李力介绍说,腾讯云在公有云、专有云和分布式云上始终坚持采用同一套代码,同源同构是腾讯云一直以来的技术坚持,也是腾讯云产品的独特优势。在云平台普遍追求功能复杂度的时代,腾讯云坚持自研,对海量高并发、柔性、可扩展等稳定性能力持续投入。如今AI和大模型时代到来,这些优势正在发挥越来越关键的价值。

在大模型训练场景中,腾讯云智算的同源同构特性,可以支撑从公有云到分布式云、私有云的平滑、灵活迁移,避免因技术栈差异导致的代码重构或适配问题。而对于大模型训练涉及的海量敏感数据,同源同构支持分布式云将算力部署在用户指定地点,确保数据不出本地。统一的云原生架构支持精细化资源调度和软硬协同优化,显著降低故障率,提升断点续算效率,从底层解决了大模型训练中常见的迁移成本高、数据合规难、资源利用率低等问题。

对于大模型企业普遍关注的成本问题,腾讯云智算则通过构建应用、数据、算力全栈云原生的技术底座,持续实现降本增效。

李力认为,云原生就是“以云的方式使用云”,是IT基础设施最佳实践的集合。算力云原生通过K8S、微服务与DevOps实现资源弹性伸缩,万核扩容进入秒级时代;数据云原生依托自研向量数据库、分布式元数据服务,支持10亿级向量规模与百万级QPS查询,数据读取效率提升10倍;应用云原生则通过模块化开发、动态伸缩等技术,降低架构复杂度,实现资源成本下降,直播带宽开销降低。腾讯云还为用户提供丰富的中间件和数据库、音视频SaaS化能力,助力用户聚焦业务创新,无需在底层技术上过度投入。

李力说,腾讯云希望为行业提供性能领先、多芯兼容、灵活部署的智算平台,帮助产业突破算力瓶颈,加速释放AI生产力。在计算层面,高性能计算集群HCC能够将启动训练时间缩短至1/30,针对AI场景定制优化自研服务器,千卡故障率低至0.16,故障恢复时间缩短至5分钟;在网络层面,自研交换机、光模块和集合通讯,训练通讯耗时降低50%,集群规模提升100%;在存储层面,自研高性能存储引擎Histor,Checkpoint写入时间降低90%,样本提升效率提升50%;基于数据平台Data Platform,全面提升数据洞察能力,实现千亿级数据管理,毫秒级延时数据查询;而通过丰富的智算生态,整合AI基础设施、开发工具及行业解决方案,打通“算力-开发-应用”全链路能力。

李力表示,腾讯云智算并非简单叠加AI能力,而是通过云原生生态体系与AI深度融合,打造真正的“AI原生云”。腾讯云将继续加大在生成式AI云基础设施上的投入,在更广泛的应用场景实践、验证和持续提升自身能力。

声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1