0

0

JavaScript如何实现语音识别_怎样将语音转为文本

狼影

狼影

发布时间:2025-12-26 21:30:08

|

689人浏览过

|

来源于php中文网

原创

javascript可通过web speech api的speechrecognition接口实现前端语音转文本,主要支持chrome和edge,需https环境及用户授权麦克风权限;不支持时可降级为后端asr服务。

javascript如何实现语音识别_怎样将语音转为文本

JavaScript 本身不直接提供语音识别能力,但可以通过浏览器内置的 Web Speech API(特别是 SpeechRecognition 接口)实现语音转文本功能。目前该 API 主要在 Chrome 和 Edge(基于 Chromium)中稳定支持,Firefox、Safari 尚未全面支持或仅提供实验性支持。

使用 Web Speech API 实现语音识别

这是当前最主流、无需后端即可在前端完成语音转文本的方式。需注意:必须在 HTTPS 环境下运行(本地 localhost 也允许),且用户需主动授权麦克风权限。

  • 创建识别实例:const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)();
  • 设置关键选项:recognition.continuous = false;(单次识别),recognition.lang = 'zh-CN';(中文识别)
  • 监听结果事件:recognition.onresult = (event) => { const text = event.results[0][0].transcript; console.log(text); };
  • 启动识别:recognition.start();(会触发用户授权弹窗)

处理兼容性与降级方案

由于 SpeechRecognition 并非所有浏览器都支持,实际项目中需做检测和提示:

Article Forge
Article Forge

行业文案AI写作软件,可自动为特定主题或行业生成内容

下载
  • 判断是否可用:if ('webkitSpeechRecognition' in window || 'SpeechRecognition' in window)
  • 对不支持的浏览器(如 Safari),可显示提示:“当前浏览器暂不支持语音识别,请使用 Chrome 或 Edge”
  • 若需全平台支持,可考虑将音频通过 MediaRecorder 录制后上传至后端语音识别服务(如阿里云 ASR、腾讯云语音识别、Whisper API)

常见问题与注意事项

实际使用中容易遇到几个典型问题:

立即学习Java免费学习笔记(深入)”;

  • 自动停止:默认识别到静音约 5 秒后自动结束。可通过 recognition.interimResults = true; 启用实时中间结果,并在 onresult 中区分 event.results[i].isFinal
  • 中文识别不准:确保设 recognition.lang = 'zh-CN';避免背景噪音;语速适中、吐字清晰效果更佳
  • 隐私提示:浏览器会在麦克风启用时显示图标,页面应明确告知用户“正在使用麦克风进行语音输入”
  • 移动端限制:部分 Android Chrome 版本可能要求用户长按说话按钮(需配合 UI 控制 start()/stop()

简单可用的代码示例

以下是一个最小可运行片段(保存为 HTML,在 Chrome 中打开即可测试):

<button id="speak">点击说话</button>
<div id="output"></div>

<script>
const btn = document.getElementById('speak');
const output = document.getElementById('output');
const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;

if (SpeechRecognition) {
  const recognition = new SpeechRecognition();
  recognition.lang = 'zh-CN';
  recognition.interimResults = true;

  recognition.onresult = (e) => {
    let text = '';
    for (let i = 0; i < e.results.length; i++) {
      text += e.results[i][0].transcript;
    }
    output.textContent = text;
  };

  btn.addEventListener('click', () => recognition.start());
} else {
  output.textContent = '您的浏览器不支持语音识别';
}
</script>

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
chrome什么意思
chrome什么意思

chrome是浏览器的意思,由Google开发的网络浏览器,它在2008年首次发布,并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容,供大家免费下载体验。

1057

2023.08.11

chrome无法加载插件怎么办
chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

838

2023.11.06

edge是什么浏览器
edge是什么浏览器

Edge是一款由Microsoft开发的网页浏览器,是Windows 10操作系统中默认的浏览器,其目标是提供更快、更安全、更现代化的浏览器体验。本专题为大家提供edge浏览器相关的文章、下载、课程内容,供大家免费下载体验。

1727

2023.08.21

IE浏览器自动跳转EDGE如何恢复
IE浏览器自动跳转EDGE如何恢复

ie浏览器自动跳转edge的解决办法:1、更改默认浏览器设置;2、阻止edge浏览器的自动跳转;3、更改超链接的默认打开方式;4、禁用“快速网页查看器”;5、卸载edge浏览器;6、检查第三方插件或应用程序等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

397

2024.03.05

如何解决Edge打开但没有标题的问题
如何解决Edge打开但没有标题的问题

若 Microsoft Edge 浏览器打开后无标题(窗口空白或标题栏缺失),可尝试以下方法解决: 重启 Edge:关闭所有窗口,重新启动浏览器。 重置窗口布局:右击任务栏 Edge 图标 → 选择「最大化」或「还原」。 禁用扩展:进入 edge://extensions 临时关闭插件测试。 重置浏览器设置:前往 edge://settings/reset 恢复默认配置。 更新或重装 Edge:检查最新版本,或通过控制面板修复

1038

2025.04.24

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

846

2023.08.22

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

562

2023.09.20

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1923

2023.10.19

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.4万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号