燧原科技首发国内第二代人工智能训练芯片“邃思2.0”- DoNews

DoNews7月7日消息（李昊原）燧原科技今日发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组，全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”，成为国内首家发布第二代人工智能训练产品组合的公司。

经过全新升级迭代后，邃思2.0的计算能力、存储和带宽、互联能力较第一代训练产品有巨大提升，对超大规模的模型支持能力获得显著增强。而同步升级的驭算TopsRider软件平台，成为燧原科技构建原始创新软件生态的基石。完全自研的软硬件架构，助力燧原科技在知识产权和产品升级迭代上可以自主掌控方向和节奏。

四大核心升级打造全新产品矩阵与智算集群

架构升级实现算力飞跃：邃思2.0进行了大规模的架构升级，新一代全自研的GCU-CARA全域计算架构，针对人工智能计算的特性进行深度优化，夯实了支持通用异构计算的基础；支持全面的计算精度，涵盖从FP32、TF32、FP16、BF16到INT8，并成为中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32峰值算力达到40 TFLOPS，单精度张量TF32峰值算力达到160 TFLOPS，均为国内第一。

HBM2E存储带来海量吞吐：邃思2.0共搭载了4颗HBM2E片上存储芯片，高配支持64 GB内存，带宽达1.8 TB/s，是中国第一个支持世界最先进存储HBM2E和单芯片64 GB内存的产品。

高速互联支撑算力扩展：GCU-LARE全域互联技术是燧原专为人工智能训练集群研发的互联技术，提供双向300 GB/s互联带宽，支持数千张云燧CloudBlazer加速卡互联，实现优异的线性加速比。

全新软件驾驭澎湃算力：驭算TopsRider是燧原科技自主知识产权的计算及编程平台，通过软硬件协同架构设计，充分发挥邃思2.0的性能；基于算子泛化技术及图优化策略，支持主流深度学习框架下的各类模型训练；利用Horovod分布式训练框架与GCU-LARE互联技术相互配合，为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口，为客户模型的优化提供了自定义的开发能力。

建设原始创新的通用算力和自主生态，加速产品商业化

“第二代人工智能训练产品的发布，是燧原科技开发原始创新的算力产品和构建自主生态又一重要的里程碑。通过芯片架构和软件平台的升级迭代，提升产品竞争力，满足市场需求，从而加速产品商业化的步伐。”燧原科技CEO赵立东指出，“在复杂的国际大环境下，原始创新和自主生态成为发展趋势，这也是燧原科技自创立以来始终坚持的战略选择，是支撑技术和业务长远发展，不断拉近与世界先进水平的距离，并在市场竞争中取得主动的基础。面向泛互联网、传统行业（金融、交通、电力、医疗、工业等）以及新基建三大业务方向，燧原科技正以全新、更具竞争力的产品，服务市场和客户。”

燧原科技CEO赵立东（左）与燧原科技COO张亚林（右）共同发布“云燧T20”训练加速卡和“邃思2.0”芯片

燧原科技COO张亚林介绍道：“邃思2.0大幅提升了算力指标，升级后的驭算软件平台更加便捷易用和客户友好，燧原科技也可针对客户的场景和业务模型提供软件定制化服务和优化，打造差异化解决方案。此外，基于云燧T20和T21训练产品、GCU-LARE互联技术和新一代驭算，燧原科技可以打造超大规模的集群产品CloudBlazer Matrix，有效降低人工智能超算集群的整体复杂度和成本，同时通过与合作伙伴的联合开发，一起构建超大规模的液冷智能数据中心，以响应国家‘低碳算力’和‘绿色一体化智能计算’的战略方向。”