js如何实现语音识别 Web Speech API实战应用

下次还敢

发布时间：2025-06-28 19:22:01

1232人浏览过

来源于php中文网

原创

javascript 可以通过 web speech api 实现语音识别，其核心接口为 speechrecognition。具体步骤如下：1. 创建 speechrecognition 对象并兼容不同浏览器前缀；2. 设置语言、连续识别模式及是否返回中间结果；3. 监听 start、result、end 和 error 等事件；4. 调用 start() 开始识别，stop() 停止识别。错误处理可通过 onerror 事件捕获常见错误类型并提示用户，如 no-speech、not-allowed、network 等。提高准确率的方法包括优化环境、清晰发音、调整语速、使用高质量麦克风及限制识别语法范围。web speech api 兼容性较好支持 chrome 和 edge，firefox 和 safari 支持较弱，不支持时可考虑第三方服务如 google cloud 或 azure speech services。

js如何实现语音识别 Web Speech API实战应用

实现语音识别，JavaScript 可以借助 Web Speech API，它提供了浏览器内置的语音识别能力，无需依赖外部库或服务。

解决方案

Web Speech API 主要包含两个接口：SpeechRecognition 和 SpeechSynthesis。前者用于语音识别，后者用于语音合成（文本转语音）。这里我们重点关注 SpeechRecognition。

基本步骤：

创建 SpeechRecognition 对象：
```
const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)();
```
这里使用了 window.SpeechRecognition || window.webkitSpeechRecognition，是因为 Chrome 早期版本使用的是带有 webkit 前缀的接口。
设置语言：
```
recognition.lang = 'zh-CN'; // 设置为中文
```
可以根据需要设置为其他语言。
设置连续识别模式（可选）：
```
recognition.continuous = false; // 默认是 false，设置为 true 可以进行连续识别
```
连续识别模式下，识别器会一直监听语音输入，直到手动停止。
设置是否返回中间结果（可选）：
```
recognition.interimResults = false; // 默认是 false，设置为 true 可以返回中间结果
```
中间结果是指在语音识别过程中，识别器返回的初步结果，这些结果可能会随着语音的继续输入而发生变化。
监听事件：
- start: 识别器开始监听语音输入时触发。
- result: 识别器识别到语音时触发，返回识别结果。
- end: 识别器停止监听语音输入时触发。
- error: 发生错误时触发。
开始识别：

知了zKnown
知了zKnown：致力于信息降噪 / 阅读提效的个人知识助手。

下载
```
recognition.start();
```
停止识别：
```
recognition.stop();
```

示例代码：

const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)();
recognition.lang = 'zh-CN';
recognition.interimResults = false;
recognition.maxAlternatives = 1; // 设置返回的最大备选结果数量，默认为 1

document.querySelector('button').addEventListener('click', () => {
  recognition.start();
});

recognition.onresult = (event) => {
  const result = event.results[0][0].transcript;
  console.log('识别结果：' + result);
  document.getElementById('output').textContent = result;
}

recognition.onerror = (event) => {
  console.error('语音识别出错：' + event.error);
};

recognition.onstart = () => {
    console.log("语音识别已启动");
}

recognition.onend = () => {
    console.log("语音识别已结束");
}

这个例子中，点击按钮会启动语音识别，识别结果会显示在 id 为 output 的元素中。

如何处理语音识别的错误？

语音识别出错很常见，网络问题、麦克风权限、浏览器兼容性等等都可能导致错误。 SpeechRecognition 对象的 onerror 事件可以捕获这些错误。

常见的错误类型：

no-speech: 没有检测到语音输入。
aborted: 识别被中止。
audio-capture: 无法获取音频输入。
network: 网络错误。
not-allowed: 没有权限使用麦克风。
service-unavailable: 语音识别服务不可用。
bad-grammar: 语法错误。
language-not-supported: 不支持的语言。

处理方法：

在 onerror 事件处理函数中，可以根据 event.error 的值来判断错误类型，并采取相应的措施。比如，如果错误类型是 not-allowed，可以提示用户检查麦克风权限。如果错误类型是 network，可以提示用户检查网络连接。

recognition.onerror = (event) => {
  console.error('语音识别出错：' + event.error);
  switch (event.error) {
    case 'no-speech':
      alert('没有检测到语音，请重试。');
      break;
    case 'network':
      alert('网络错误，请检查网络连接。');
      break;
    case 'not-allowed':
      alert('请允许浏览器使用麦克风。');
      break;
    default:
      alert('发生未知错误，请重试。');
  }
};

如何提高语音识别的准确率？

语音识别的准确率受到很多因素的影响，比如环境噪音、口音、语速等等。可以尝试以下方法来提高准确率：

优化环境： 尽量在安静的环境中使用语音识别，避免噪音干扰。
清晰发音： 尽量用清晰、标准的普通话发音。
调整语速： 语速不宜过快或过慢，保持适中。
使用合适的麦克风： 高质量的麦克风可以提高音频质量，从而提高识别准确率。
使用 Web Speech API 的高级特性： 比如，可以使用 SpeechGrammarList 对象来指定语法，限制识别范围，从而提高准确率。

关于 SpeechGrammarList:

SpeechGrammarList 可以用来定义一组语法，告诉识别器只识别这些语法中的内容。比如，可以定义一组命令，让识别器只识别这些命令。

const grammar = '#JSGF V1.0; grammar colors; public  = red | green | blue | yellow | purple ;'
const speechRecognitionList = new (window.SpeechGrammarList || window.webkitSpeechGrammarList)();
speechRecognitionList.addFromString(grammar, 1);
recognition.grammars = speechRecognitionList;

这段代码定义了一个名为 colors 的语法，它包含 red, green, blue, yellow, purple 这几个颜色。然后，将这个语法添加到 SpeechRecognition 对象的 grammars 属性中。这样，识别器就只会识别这几个颜色。

Web Speech API 的兼容性如何？

Web Speech API 的兼容性取决于浏览器。目前，Chrome 和 Edge 对 Web Speech API 的支持较好，Firefox 和 Safari 的支持相对较弱。可以使用 window.SpeechRecognition 和 window.SpeechGrammarList 来检测浏览器是否支持 Web Speech API。

if ('SpeechRecognition' in window) {
  // 支持 Web Speech API
  console.log('支持 Web Speech API');
} else {
  // 不支持 Web Speech API
  console.log('不支持 Web Speech API');
  alert('您的浏览器不支持 Web Speech API，请更换浏览器。');
}

如果浏览器不支持 Web Speech API，可以考虑使用第三方的语音识别库，比如 Google Cloud Speech-to-Text API、Microsoft Azure Speech Services 等。这些第三方库通常提供更强大的功能和更高的准确率，但也需要付费使用。

javascript如何优化页面性能？【教程】

javascript性能如何优化_有哪些常见的代码优化策略【教程】

javascript事件委托是什么_它如何提高网页的性能【教程】

javascript深拷贝是什么_如何实现对象和数组的深拷贝【教程】

SpeechSynthesis.getVoices() 返回空数组的解决方案

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：js怎样实现人脸检测功能浏览器人脸检测的4种实现方案下一篇：如何检测元素是否在视口内？

作者最新文章

硬盘分区合并不了_在不丢失数据的情况下调整分区【方法】

2026-01-29 09:30

网易大神怎么绑定游戏网易大神绑定游戏角色方法【教程】

2026-01-29 09:31

C++ 怎么防止头文件重复包含 C++ pragma once与ifndef对比【预处理】

2026-01-29 09:32

C++ struct和class区别 C++结构体与类默认权限对比【概念】

2026-01-29 09:34

什么是摆烂摆烂的网络含义及用法【介绍】

2026-01-29 09:36

C++ 怎么读取二进制文件 C++ fstream二进制模式读写操作【实战】

2026-01-29 09:39

什么是云吸猫云吸猫的流行现象【介绍】

2026-01-29 09:41

C++ 怎么格式化输出时间 C++ put_time与strftime使用教程【日期】

2026-01-29 09:44

沪是哪个城市的简称中国各省市简称及车牌代码

2026-01-29 09:47

云原神延迟高怎么办_云原神网络连接优化与降低延迟技巧【教程】

2026-01-29 09:47

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

chrome什么意思

chrome是浏览器的意思，由Google开发的网络浏览器，它在2008年首次发布，并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容，供大家免费下载体验。

833

2023.08.11

chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题，详情请看本专题下面的文章。php中文网欢迎大家前来学习。

744

2023.11.06

edge是什么浏览器

Edge是一款由Microsoft开发的网页浏览器，是Windows 10操作系统中默认的浏览器，其目标是提供更快、更安全、更现代化的浏览器体验。本专题为大家提供edge浏览器相关的文章、下载、课程内容，供大家免费下载体验。

1416

2023.08.21

IE浏览器自动跳转EDGE如何恢复

ie浏览器自动跳转edge的解决办法：1、更改默认浏览器设置；2、阻止edge浏览器的自动跳转；3、更改超链接的默认打开方式；4、禁用“快速网页查看器”；5、卸载edge浏览器；6、检查第三方插件或应用程序等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

381

2024.03.05

如何解决Edge打开但没有标题的问题

若 Microsoft Edge 浏览器打开后无标题（窗口空白或标题栏缺失），可尝试以下方法解决：重启 Edge：关闭所有窗口，重新启动浏览器。重置窗口布局：右击任务栏 Edge 图标 → 选择「最大化」或「还原」。禁用扩展：进入 edge://extensions 临时关闭插件测试。重置浏览器设置：前往 edge://settings/reset 恢复默认配置。更新或重装 Edge：检查最新版本，或通过控制面板修复

941

2025.04.24

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

228

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

297

2023.10.25

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1130

2023.10.19