记者邓天心/综合报导
Google近日官宣,将在Google翻译(Google Translate)App中正式上线全新「转录」(Transcribe)功能,使该服务在实时性与语义准确性上更贴近专业人工口译。该功能将率先面向Android用户分批推送,预计在未来数月内全面覆盖;而iOS平台的适配计划及上线时间,Google暂未对外披露。

该功能底层逻辑与Google Recorder(录音工具)的实时语音转文字高度协同,但能力维度显著升级——不仅可同步捕捉语音并生成原文逐字稿,更能即时将其翻译为目标语言。无论应用于跨国会议、学术讲座,抑或日常多语种交流场景,用户均可在收听原声的同时,于屏幕上近乎同步地查看翻译文本。
尽管完整交互演示尚未公开,但在旧金山举办的发布会上,Google播放了一段实机演示视频。画面显示,其转录响应速度、断句自然度及界面流畅性,已接近Google Recorder与系统级「实时字幕」(Live Captions)的成熟水准。
更多科技工作请上科技专区:https://www.php.cn/link/d4b949cac7611fae5f8dee7eae4f6caf
需注意的是,Google翻译并非采用“整句一次性处理”的模式,而是以语义连贯的小片段为单位进行识别与翻译。官方解释称,这源于翻译任务本身的复杂性远超单纯语音转写——正如人类译员需数秒理解上下文、语气与隐含意图后,方能选择最贴切的表达方式,AI翻译系统同样需要预留必要的推理窗口,以提升最终输出的准确性与自然度。
Google Translate产品经理尼克·拉迪切维奇(Nick Radicevic)在发布会上表示:“我们的长期目标,是让机器翻译在关键指标上逼近母语级译者的专业水准。这并非遥不可及,而是我们正全力推进的方向。”
他也指出,实际转录效果会受多重现实因素制约:例如设备麦克风的拾音灵敏度、手机保护壳是否遮挡收音孔、环境背景噪音水平,以及不同语言间语法结构、语序习惯与文化负载词的差异等。不过他强调,团队正持续优化模型,确保当前支持的全部主流语言均能稳定启用该功能。
尽管硬件与声学条件仍构成一定挑战,但转录功能的落地,无疑为Google翻译的技术演进打开了全新维度。类比Google助理「同传模式」在短时对话中的高效表现,此次升级更着眼于长时、高信息密度的跨语言音频内容,有望实质性降低全球范围内的语言沟通门槛。
延伸阅读:
不满五角大厦协议!OpenAI硬件主管请辞 质疑国安红线模糊










