央视点赞！声网赋能时空壶 AI 翻译耳机，让跨语种对话零障碍- DoNews

在全球化浪潮推动下,跨语言沟通需求呈井喷式增长,AI 翻译耳机市场迎来了前所未有的发展机遇。时空壶(深圳时空壶技术有限公司)深耕 AI 翻译耳机领域,近日,其研发的 AI 翻译耳机凭借卓越性能,连续两次登上央视,成为行业焦点。

在央视《朝闻天下》及《新闻联播》报道中提到,时空壶团队耗时 3 年多,进行 3 个产品迭代,潜心攻克同声传译的通信、降噪等核心难题,通过全球首创的算法,让跨语种沟通更加准确、自然,实现“无感”交流。

在卓越的使用体验背后,既有时空壶在翻译耳机领域多年的深厚技术沉淀,以及对海量使用场景的反复打磨,也离不开声网 RTC 技术的关键支持。

AI 翻译耳机两大难题:降噪和双向通信近年来,AI 翻译耳机市场发展迅猛,翻译耳机的全球出货量以年均 62% 的增速狂飙。然而,要实现自然、流畅的跨语言沟通,AI 翻译耳机面临着诸多技术挑战,降噪和双向通信两大难题。

2019年,时空壶发布了随身翻译机Zero,Zero一经面世便取得了不错的销量,斩获多项国际大奖。但现实使用场景远比实验室复杂得多,不到两个月,产品遭遇大量退单。其中最主要的原因是,不少用户反馈产品降噪功能欠佳,严重影响翻译效果。在展会现场、喧闹的地铁站等嘈杂环境中,耳机难以准确捕捉用户语音,翻译的准确性和效率也会大打折扣。

与此同时,在实时翻译过程中,翻译延迟也是影响用户体验的重要因素,延迟过高会导致沟通的连贯性被破坏。在进行语音识别时,由于数据需在多个系统模块间流转,会产生一定的时间损耗;此外,在网络不佳的情况下,传输延迟也会进一步加剧翻译延迟。

W4 Pro 响应延迟低至0.2秒,媲美世界顶尖译员经过3 年多时间的3次产品迭代,时空壶在2024年9月推出了全球首款开放式 AI 同传翻译耳机 W4 Pro,搭载其业内首创的 Babel OS 同传系统,实现了 “端、边、云” 全链路信息处理能力的飞跃,让响应延迟缩短至 0.2 秒,几乎与原声同步,极大提升了沟通的流畅性,翻译延迟压缩至仅一句话的时间(3-5秒),达到世界顶尖译员的水平。

在翻译准确率方面,W4Pro 支持 40 种语言及 93 种口音间的任意两种语言即时互译,平均准确率高达 96%,无论是常见语言还是小众方言,都能精准解读,远超同类产品平均水平。

在音频降噪方面,W4Pro采用了三麦克风结构与矢量降噪技术,有效过滤背景噪音,大幅提高降噪效率,确保翻译的准确性。测试数据显示,在85分贝的嘈杂环境中,其语音识别准确率仍保持在92%以上。

在网络传输方面,W4Pro 借助音频压缩算法的弱网优化,以及声网的抗弱网传输和抗丢包算法,即使在跨国视频会议中遭遇网络波动,翻译稳定性仍也能提升40%。

W4Pro的应用场景十分广泛,不仅能满足面对面翻译需求,还能覆盖外语电话、远程会议、新闻演讲、网课等翻译场景,将「个人翻译」的体验提升到新高度。

自推出以来,时空壶 W4Pro 在市场上成绩亮眼。2024 年,公司营收过亿,增速达 60%,其中 W 系列翻译耳机近三年出口每年增长超 100%。在国际电商平台亚马逊上,W4Pro 也脱颖而出,摘得 “亚马逊翻译机最佳销量” 桂冠,深受全球消费者青睐。

声网技术赋能,让跨语种沟通零障碍在攻克 AI 翻译耳机在响应延迟与降噪方面的难题时,声网凭借深厚的技术沉淀,构建了一套完整的解决方案。从网络传输、音频算法处理,到交互体验优化与硬件适配,声网都具备行业领先的独特优势。

超低延时,响应更快速

声网凭借专业的全球网络部署与超低延迟传输技术,为 AI 翻译耳机的低延时响应提供了有力保障。声网自研的 SD-RTN™ 实时传输网络覆盖全球 200 多个国家与地区,显著提升了用户接入速度,降低了端到端延迟。

声网自研的抗弱网传输与抗丢包算法,结合网络探测、抗丢包技术、自适应jitter buffer、网络拥塞控制策略等,能够在 80% 丢包的恶劣网络环境下,依然保障音视频通话的流畅性,确保翻译数据能够及时、稳定地传输,避免因网络问题导致的翻译延迟。

AI降噪,对话更清晰

针对语音对话中经常会出现的噪音、回声等问题,声网拥有行业领先的音频 3A 能力,通过 AI 噪声抑制、背景人声过滤、音乐检测/过滤等算法,能够智能屏蔽95%交互中的各类背景人声与噪声干扰,确保语音不受环境干扰,为用户打造清晰、流畅的对话体验。

智能打断,对话更自然

在“双向同传”过程中,用户只需开口说话、无需双手操作、无需等待对方翻译、随时都能插话。凭借声网先进的 AI 语音活动检测(AI VAD)技术,可实现灵敏的自然语音打断,模拟人类对话的自然流动,让对话更加真实、自然。

主流芯片支持,适配更广泛

在硬件场景构建音视频互动时, SDK 对芯片、系统的适配性以及包体的体积至关重要。声网支持适配支持 70+ 主流、高性价比的主流芯片/模组。集成包体积增量也<400KB,支持在 RTOS、EmbedLinux 等低功耗系统流畅运行,同时 SDK 还支持 PCM、G711U/A、G722、AAC、OPUS 等多种音频格式。

目前,时空壶 AI 翻译耳机在全球市场上取得了亮眼的成绩,产品远销全球 170 多个国家和地区,北美市场占有率达到了 40%。

未来,声网将与时空壶继续深化合作,不断探索 AI 翻译耳机技术的新边界。双方将持续优化技术能力,进一步提升产品性能,为用户带来更加自然、流畅、高效的跨语言沟通体验,共同推动 AI 翻译耳机行业的发展,为全球用户搭建更加便捷的语言沟通桥梁。

声明：本站转载此文目的在于传递更多信息，并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容,本网站对此声明具有最终解释权。