0

0

Python如何实现语音识别?SpeechRecognition库实战教程

絕刀狂花

絕刀狂花

发布时间:2025-07-16 16:25:02

|

960人浏览过

|

来源于php中文网

原创

语音识别在python中并不难,主要通过speechrecognition库实现。1. 安装speechrecognition和依赖:执行pip install speechrecognition及pip install pyaudio,linuxmacos可能需额外安装portaudio开发库。2. 实时录音识别:导入模块并创建recognizer对象,使用microphone监听音频,调用recognize_google方法进行识别,支持中文需加language="zh-cn"参数。3. 处理本地音频文件:使用audiofile读取wav文件,同样调用识别引擎处理。4. 可选识别引擎包括cmu sphinx(离线识别)、google cloud speech(付费api)等,可根据需求选择。5. 识别出错时可调整参数如adjust_for_ambient_noise、timeout、phrase_time_limit以优化效果。掌握这些步骤即可实现基础语音助手或控制程序。

Python如何实现语音识别?SpeechRecognition库实战教程

语音识别在Python里其实没有想象中那么难,尤其是有了SpeechRecognition这个库之后。它封装了多种语音识别引擎和API,能让你用几行代码就把音频转成文字。

Python如何实现语音识别?SpeechRecognition库实战教程

安装SpeechRecognition和依赖项

要使用SpeechRecognition,首先得安装它本身以及相关的依赖。最基础的命令是:

Python如何实现语音识别?SpeechRecognition库实战教程
pip install SpeechRecognition

但光这样还不行,因为默认情况下它不带语音识别引擎。如果你打算用Google Web Speech API(免费、无需注册),还需要安装pyaudio来获取麦克风输入:

立即学习Python免费学习笔记(深入)”;

pip install pyaudio

注意:在Linux或macOS上可能需要额外安装PortAudio开发库才能编译PyAudio。

Python如何实现语音识别?SpeechRecognition库实战教程

从麦克风录音并识别

这是最常用也最有意思的部分——实时听你说话然后识别出来。步骤大致如下:

  • 导入模块并创建Recognizer对象
  • 使用Microphone作为源来监听音频
  • 用recognize_google方法进行识别

示例代码:

import speech_recognition as sr

r = sr.Recognizer()
with sr.Microphone() as source:
    print("请说话...")
    audio = r.listen(source)

try:
    text = r.recognize_google(audio, language="zh-CN")
    print("你说的是:" + text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求出错;{e}")

这段代码会监听一次麦克风输入,然后调用Google的API进行识别。如果你希望支持中文,记得加上language="zh-CN"参数。

歌者PPT
歌者PPT

歌者PPT,AI 写 PPT 永久免费

下载

处理本地音频文件

除了实时录音,SpeechRecognition也能处理WAV格式的音频文件。其他格式比如MP3需要先转换一下。

步骤类似,只是把Microphone换成AudioFile

with sr.AudioFile('example.wav') as source:
    audio = r.record(source)  # 读取整个文件

然后同样用recognize_google或者其他引擎去识别。这种方法适合做批量语音转文字的任务,比如会议记录、视频字幕提取等。

可选识别引擎和注意事项

SpeechRecognition支持多个引擎,比如CMU Sphinx(本地识别,不需要联网)、Google Cloud Speech(需付费API密钥)、Microsoft Bing Voice Recognition等。

常用的几个方式对比:

  • Google Web Speech API:免费,简单好用,但识别中文有时候不太准
  • CMU Sphinx:离线可用,速度快,但准确率略低
  • Google Cloud Speech:更强大,支持更多语言和高级功能,但需要网络+付费授权

另外,如果识别不出来或者总是出错,可以尝试调整以下参数:

  • adjust_for_ambient_noise():用于消除背景噪音
  • timeoutphrase_time_limit:控制监听时间长度
  • 提高录音质量或改用外接麦克风

基本上就这些。掌握这几个关键点,就能用Python做出一个简单的语音助手或者语音控制程序了。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

437

2024.12.20

pip设置清华源
pip设置清华源

设置方法:1、打开终端或命令提示符窗口;2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件;3、打开pip.conf文件,然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容,这将把pip的镜像源设置为清华大学的镜像源;4、保存并关闭文件即可。

803

2024.12.23

python升级pip
python升级pip

本专题整合了python升级pip相关教程,阅读下面的文章了解更多详细内容。

371

2025.07.23

macOS怎么切换用户账户
macOS怎么切换用户账户

在 macOS 系统中,可通过多种方式切换用户账户。如点击苹果图标选择 “系统偏好设置”,打开 “用户与群组” 进行切换;或启用快速用户切换功能,通过菜单栏或控制中心的账户名称切换;还能使用快捷键 “Control+Command+Q” 锁定屏幕后切换。

359

2025.05.09

vsd文件打开方法
vsd文件打开方法

vsd文件打开方法有使用Microsoft Visio软件、使用Microsoft Visio查看器、转换为其他格式等。想了解更多vsd文件相关内容,可以阅读本专题下面的文章。

510

2023.10.30

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1564

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.6万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号