国产AI翻译更“智慧”

2025-09-05 07:56 来源:人民日报海外版
查看余下全文
(责任编辑:王婉莹)
手机看中经经济日报微信中经网微信

国产AI翻译更“智慧”

2025年09月05日 07:56   来源:人民日报海外版   

今年以来,中国人工智能大模型等为代表的数字技术迅速发展,国产AI逐渐赋能千行百业,让人有了切切实实的感受。

前不久,在上海举办的2025世界人工智能大会上,2024年诺贝尔物理学奖获得者杰弗里·辛顿发表题为《数字智能是否会取代生物智能》的演讲,提出自己对人工智能发展的建议。演讲结束后,中国外交部原副部长傅莹和辛顿偶遇,发生了一段耐人寻味的对话。

傅莹说:“杰弗里,今天你的演讲我听得非常清楚,屏幕上有实时中文翻译字幕,AI一直在翻译你的话。”

辛顿略显意外:“我看不到屏幕,但我耳机里听到的是人工翻译。”

傅莹回应:“所以,AI在聆听你。”

这项“听懂”辛顿的AI技术,来源于中国企业科大讯飞。辛顿以英文形式演讲,专业词汇多、理解难度大,AI如何将中英同传首字响应压缩到2秒以内,达到了人类顶尖同传译员的反应速度?这背后涉及底层技术的攻关。

“传统模式下,机器翻译要经历‘源语音—源文字—翻译—目标文字—目标语音’五段跳,因此效率低、延时长。”科大讯飞副总裁、安徽听见科技有限公司总经理王玮介绍,“不少人可能有这样的体验,用手机软件语音翻译时,先在屏幕上识别出中文,再花时间翻译成外语。而现在,我们的技术能实现源语音到目标语音的端到端翻译。”

当前,中国已发布超1500个大模型,在全球已发布的大模型中数量位居首位。从“边听边说”到“语音同传”,背后离不开讯飞星火语音同传大模型的支撑。

更进一步,有没有可能让机器从单项语言的识别翻译,到多项语言混合的识别和翻译?

今年7月,香港立法会正式推出与科大讯飞联合打造的智慧誊录系统“智识听”AI实时字幕功能。公众可以通过立法会网站的网上广播等平台收看带有实时字幕的立法会大会会议直播。该功能受到香港特区立法会主席梁君彦的线上“点赞”。

“‘智识听’建设历时近三年,其间,遇到最棘手的技术问题就是如何提高三语混读引擎识别率。”王玮介绍说,会议中可能出现普通话、粤语、英语三种语言,英语识别率下降到85%左右,必须使用三语混读引擎。

如何解决?一方面是引擎升级,从CPU版本换成了GPU版本;另一方面,香港立法会提供了包含2.5亿汉字的中英文对照和20万个高频粤语词汇,助力机器学习,提升文本翻译的效果。

如今“智识听”实时字幕的准确率达96%,通过人工即时修正后准确率可达99%。会议的逐字记录效率也因此项技术的落地大幅提升。

“未来,我们将不断强化多语种支持能力,将逐步覆盖‘一带一路’共建国家重点语种字幕生成,助力香港连接国际舞台。”王玮说。 (本报记者  赵  昊)

(责任编辑:王婉莹)

精彩图片