zoom原生不支持中文语音字幕,可通过三种方式实现:一、启用内置英文自动生成字幕,再用浏览器扩展实时翻译为中文;二、用obs studio配合ai语音识别插件本地转写中文;三、调用zoom api对接asr服务(如腾讯云)推送至自定义前端字幕面板。

如果您在使用Zoom进行会议或网络研讨会时希望为参与者提供实时字幕支持,Zoom本身支持自动生成英文语音字幕,但**原生不支持直接生成中文语音字幕**。以下是实现Zoom中文字幕的可行方法:
一、启用Zoom内置英文自动字幕并配合第三方工具转译
该方法利用Zoom官方提供的实时英文语音识别字幕功能,再通过浏览器扩展或独立软件将英文文本实时翻译为中文,最终以悬浮窗或字幕条形式呈现。
1、登录Zoom桌面客户端,进入“设置” > “字幕”选项卡。
2、勾选“为我的会议和网络研讨会启用自动生成字幕”。
3、开启会议后,在会议控制栏点击“字幕”按钮 → 选择“开始自动生成字幕”,此时仅显示英文实时字幕。
4、在Chrome浏览器中安装支持实时翻译的扩展程序,例如“Live Caption Translator”或“Subtitles for Zoom”。
5、启动扩展,设置源语言为英语、目标语言为中文,并启用“捕获Zoom字幕区域文本”功能。
二、使用OBS Studio + AI语音识别插件实现端到端中文字幕
此方案绕过Zoom内置限制,通过采集Zoom会议音频流,经本地AI语音识别模型转写为中文文本,并叠加为视频字幕输出,适用于录播或需高准确率字幕的场景。
1、下载并安装OBS Studio(版本29.1或更高)及插件“OBS Websocket”和“Speech-to-Text Plugin”。
2、在插件设置中选择中文语音识别引擎,如“Whisper.cpp”本地模型或接入“阿里云ASR”API密钥。
3、在OBS中添加“窗口捕获”,选择Zoom会议窗口作为视频源;再添加“音频输入捕获”,选择Zoom通话音频设备。
4、启用Speech-to-Text插件,设置输出格式为SRT且启用实时字幕渲染器。
5、点击OBS“开始录制”或“开始推流”,字幕将实时生成并显示在画面底部。
三、通过Zoom API + 自建Web字幕面板集成
适用于企业IT管理员或开发者,调用Zoom Events API获取实时语音事件流,结合ASR服务(如腾讯云语音识别)完成中文转写,并推送至定制化前端字幕面板。
1、在Zoom App Marketplace创建JWT应用,开通“meeting_events:read:admin”权限并记录API Key与Secret。
2、部署Node.js服务监听Zoom Meeting Participant Joined、Recording Started等事件。
3、当检测到发言人语音活动时,调用腾讯云ASR接口上传10秒音频片段,设置参数"EngineModelType": "16k_zh"。
4、接收ASR返回的JSON结果,提取“Text”字段,通过WebSocket广播至参会者浏览器中的字幕HTML面板。
5、前端使用CSS定位固定字幕区域,字体大小设为28px以上并启用阴影增强可读性。










