盲盒快讯‌

科大讯飞自研大模型发布AI翻译耳机,其意义何在?

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

10月14日,科大讯飞宣布升级AI同传技术,同时发布AI翻译耳机等产品。

目前,讯飞AI同传首字响应时间降低至2秒,重点针对医疗、金融、法律等专业需求较高的行业将专业词库扩充到10万余个,并提升了语音播报的自然和拟人程度。其中,中英同传加入了声音复刻功能,即用户利用一句话语音样本,以自己的声音播报翻译结果。 

在产品展示环节,讯飞通过实时连线迪拜Gitex Global展会,展示了AI同传在复杂网络环境下的稳定性与低延迟能力。公司方面称,这一场景不仅要求算法性能,也考验端到端同传大模型在弱网条件下的算力调度与容错机制。 

产品方面,讯飞此次发布的AI翻译耳机具备通话实时翻译、面对面翻译、线上同传等功能。针对AI语音翻译在嘈杂场景中的应用,讯飞强调其AI降噪系统,采用了多麦克风组合、30度拾音角度设计,并加入了ENC降噪算法。

讯飞的AI翻译能力是其翻译领域硬件产品的核心支撑。科大讯飞副总裁赵翔曾在受访时对界面新闻记者表示,AI翻译场景的体验提升,是一个“软硬件强耦合的系统性工程”。除了模型能力本身的演进,更需要芯片、声学结构、算法、应用场景的融合与优化。这也是讯飞坚持自研同传大模型的核心原因之一。 

相比之下,目前市场上部分AI翻译硬件采用外部大模型API调用,以争取在早期阶段快速推出产品。不过,这一策略在性能调优、数据安全与差异化体验方面是否受限,在行业中仍有争议。

科大讯飞副总裁赵翔(图片来源:科大讯飞)

讯飞研究院常务副院长高建清指出:“如果只是基于开源模型做微调,很难做到国际领先。我们的很多任务需要在保护隐私的前提下进行联合数据训练,没有自研模型底座,很难在效率与效果上保持优势。”

这番表态揭示了讯飞的技术路径选择:通过自研大模型,建立从底层算法到终端产品的完整技术栈,以控制模型的迭代节奏、适配能力与数据安全边界。

此次发布背后,讯飞也在加快其国际化步伐。公司宣布新增中英到阿拉伯语、西班牙语的同传互译功能,意在支撑出海企业及跨境交流的需求。根据讯飞数据,中国机器翻译市场规模约600亿元,对应全球市场约600亿美元。随着中国企业国际化程度加深,AI翻译硬件与服务仍有巨大的增长空间。 

论及多语种路线的竞争优势,高建清告诉界面新闻记者,小语种的AI翻译研发不仅需要技术创新,也有大量非常细节的人力投入,不是所有厂商都能投入其中。 

从行业层面看,随着大模型性能提升,AI翻译进入更成熟的竞争阶段。对讯飞而言,模型能力的差异化,将不仅决定准确率,也会对延迟、拟人度、场景理解和隐私合规性等产生影响。而掌握底层模型、拥有真实数据与算力积累是否是持续突破的关键,将在未来不久迎来答案。

相关推荐