0

0

HTML5怎样用SpeechRecognition取语音转文本数据_HTML5语音取数法【综览】

看不見的法師

看不見的法師

发布时间:2026-01-12 22:51:34

|

334人浏览过

|

来源于php中文网

原创

speechrecognition 仅在 chrome(89+、https/localhost)中可用,firefox/safari/edge 已弃用或从未支持;替代方案为 webrtc+第三方asr 或录音文件上传后端转写。

html5怎样用speechrecognition取语音转文本数据_html5语音取数法【综览】

SpeechRecognition API 在大多数现代浏览器中不可用,SpeechRecognition 不是稳定标准,Chrome 是唯一长期支持它的桌面浏览器,且仅限 HTTPS 环境;其他浏览器(Firefox、Safari、Edge)已弃用或从未实现。

为什么 SpeechRecognition 在 Firefox / Safari / Edge 中不工作

Firefox 从 2021 年起移除了对 SpeechRecognition 的支持;Safari 从未实现;Edge 自 Chromium 内核切换后短暂支持过,但新版已默认禁用该接口。调用 new SpeechRecognition() 会直接抛出 ReferenceError: SpeechRecognition is not defined

  • 检查方式:在控制台运行 typeof SpeechRecognition,返回 "undefined" 即代表不可用
  • 即使检测到构造函数存在,也需确认页面是否通过 HTTPS 加载——HTTP 下 Chrome 会静默禁用
  • webkitSpeechRecognition 是旧版 Chrome 的前缀版本,现已被统一为无前缀的 SpeechRecognition,但行为一致

Chrome 中启用 SpeechRecognition 的必要条件

必须同时满足三项,缺一不可:

  • 使用 Chrome 89+(推荐 110+)
  • 页面部署在 HTTPS 协议下(localhost 也允许)
  • 用户已授予权限:首次调用 recognition.start() 时会触发麦克风权限弹窗,拒绝后需手动在地址栏点击锁形图标重置权限

常见失败现象:onend 立即触发、onerror 返回 error: not-allowedaborted,基本都指向权限或协议问题。

腾讯混元
腾讯混元

腾讯混元大由腾讯研发的大语言模型,具备强大的中文创作能力、逻辑推理能力,以及可靠的任务执行能力。

下载

立即学习前端免费学习笔记(深入)”;

基础可用代码示例(仅限 Chrome + HTTPS)

以下是最小可运行片段,含错误防护和状态反馈:

const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
if (!SpeechRecognition) {
  console.error('SpeechRecognition not supported');
} else {
  const recognition = new SpeechRecognition();
  recognition.continuous = false; // 单次识别,避免自动重听
  recognition.interimResults = false; // 不返回中间结果,减少噪声
  recognition.lang = 'zh-CN'; // 显式指定中文,否则可能识别为英文

  recognition.onresult = (event) => {
    const transcript = event.results[0][0].transcript;
    console.log('识别结果:', transcript);
  };

  recognition.onerror = (event) => {
    console.error('语音识别错误:', event.error);
  };

  recognition.start(); // 触发权限请求
}

替代方案比强行兼容更实际

想跨浏览器获取语音转文本,不要押注 SpeechRecognition —— 它不是“暂时没支持”,而是已被 W3C 移出活跃标准草案。可行路径只有两条:

  • 用 WebRTC + 第三方 ASR 服务(如 Azure Cognitive Services、阿里云智能语音交互、讯飞开放平台),自己采集音频流并上传识别
  • 降级为按钮录音 + 文件上传 + 后端转写(<input type="file" accept="audio/*">),绕过实时麦克风限制

真正容易被忽略的一点:很多开发者花半天调试 SpeechRecognition,却没意识到,只要页面不是 HTTPS,连 getUserMedia 都拿不到麦克风流——这是整个语音链路的前提,比 API 是否存在更底层。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
html5动画制作有哪些制作方法
html5动画制作有哪些制作方法

html5动画制作方法有使用CSS3动画、使用JavaScript动画库、使用HTML5 Canvas等。想了解更多html5动画制作方法相关内容,可以阅读本专题下面的文章。

543

2023.10.23

HTML与HTML5的区别
HTML与HTML5的区别

HTML与HTML5的区别:1、html5支持矢量图形,html本身不支持;2、html5中可临时存储数据,html不行;3、html5新增了许多控件;4、html本身不支持音频和视频,html5支持;5、html无法处理不准确的语法,html5能够处理等等。想了解更多HTML与HTML5的相关内容,可以阅读本专题下面的文章。

464

2024.03.06

html5从入门到精通汇总
html5从入门到精通汇总

想系统掌握HTML5开发?本合集精选全网优质学习资源,涵盖免费教程、实战项目、视频课程与权威电子书,从基础语法到高级特性(Canvas、本地存储、响应式布局等)一应俱全,适合零基础小白到进阶开发者,助你高效入门并精通HTML5前端开发。

259

2025.12.30

html5新老标签汇总
html5新老标签汇总

HTML5在2026年持续优化网页语义化与交互体验,不仅引入了如<header>、<nav>、<article>、<section>、<aside>、<footer>等结构化标签,还新增了<video>、<audio>、<canvas>、<figure>、<time>、<mark>等增强多媒体与

222

2025.12.30

html5空格代码怎么写
html5空格代码怎么写

在HTML5中,空格不能直接通过键盘空格键实现,需使用特定代码。本合集详解常用空格写法:&nbsp;(不间断空格)、&ensp;(半个中文空格)、&emsp;(一个中文空格)及CSS的white-space属性等方法,帮助开发者精准控制页面排版,避免因空格失效导致布局错乱,适用于新手入门与实战参考。

103

2025.12.30

html5怎么做网站教程
html5怎么做网站教程

想从零开始学做网站?这份《HTML5怎么做网站教程》合集专为新手打造!涵盖HTML5基础语法、页面结构搭建、表单与多媒体嵌入、响应式布局及与CSS3/JavaScript协同开发等核心内容。无需编程基础,手把手教你用纯HTML5创建美观、兼容、移动端友好的现代网页。附实战案例+代码模板,快速上手,轻松迈出Web开发第一步!

165

2025.12.31

HTML5建模教程
HTML5建模教程

想快速掌握HTML5模板搭建?本合集汇集实用HTML5建模教程,从零基础入门到实战开发全覆盖!内容涵盖响应式布局、语义化标签、Canvas绘图、表单验证及移动端适配等核心技能,提供可直接复用的模板结构与代码示例。无需复杂配置,助你高效构建现代网页,轻松上手前端开发!

47

2025.12.31

html5怎么使用
html5怎么使用

想快速上手HTML5开发?本合集为你整理最实用的HTML5使用指南!涵盖HTML5基础语法、主流框架(如Bootstrap、Vue、React)集成方法,以及无需安装、直接在线编辑运行的平台推荐(如CodePen、JSFiddle)。无论你是新手还是进阶开发者,都能轻松掌握HTML5网页制作、响应式布局与交互功能开发,零配置开启高效前端编程之旅!

67

2025.12.31

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

24

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.5万人学习

AngularJS教程
AngularJS教程

共24课时 | 3.9万人学习

CSS教程
CSS教程

共754课时 | 37.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号