0

0

PHP怎样集成科大讯飞语音AI_上传音频调接口转文字内容【应用】

蓮花仙者

蓮花仙者

发布时间:2026-01-13 09:26:57

|

613人浏览过

|

来源于php中文网

原创

科大讯飞语音转文字接口需传Base64编码的PCM音频(16bit、单声道、16kHz),PHP中用ffmpeg转码为raw PCM再base64_encode;签名需用api_key、api_secret和RFC1123时间戳生成HMAC-SHA256,并设正确Authorization头;cURL须配置application/json、SSL验证及超时;接口返回完整JSON,非流式,解析ws数组拼接文字。

php怎样集成科大讯飞语音ai_上传音频调接口转文字内容【应用】

科大讯飞语音转文字接口怎么传音频文件

科大讯飞 WebAPI 的语音识别(iFlytek Speech-to-Text)不支持直接上传原始音频文件,必须先将音频转为 Base64 编码字符串,并通过 JSON body 提交。常见错误是用 file_get_contents() 读取后直接 POST 二进制流——这会导致 400 Bad Request10203 音频格式错误

  • 音频必须为 PCM(16bit、单声道、16kHz),WAV 封装需去除头信息(只留 raw PCM);MP3/AMR/AAC 等格式必须先转码
  • PHP 中推荐用 ffmpeg 命令行转码:
    ffmpeg -y -i input.mp3 -ar 16000 -ac 1 -f s16le -acodec pcm_s16le output.pcm
  • 再用 base64_encode(file_get_contents('output.pcm')) 得到 audio 字段值
  • 注意:Base64 字符串不能换行,需用 str_replace(["\n", "\r", " "], "", $base64) 清理

PHP 怎么构造带签名的 POST 请求调讯飞 API

讯飞要求每个请求携带 Authorization 头,由 api_keyapi_secret 和当前时间戳共同生成 HMAC-SHA256 签名。漏掉任一参数或时间偏差超过 15 分钟,都会返回 10201 签名验证失败

  • api_keyapi_secret 来自讯飞开放平台「我的应用」→「接口秘钥」
  • 签名原文格式为:host: ws-api.xfyun.cn\ndate: [RFC1123 格式时间]\nGET /v2/tts HTTP/1.1(注意换行符是 \n,不是 \r\n
  • PHP 中用 gmdate('D, d M Y H:i:s \G\M\T') 生成标准时间,别用 date()
  • 最终 Authorization 头格式:hmac username="your_app_id", algorithm="hmac-sha256", headers="host date request-line", signature="{sign}"

PHP cURL 调用讯飞 STT 接口的关键配置项

直接用 file_get_contents() 或简单 curl_setopt($ch, CURLOPT_POSTFIELDS, $json) 容易失败,核心在于 Content-Type、SSL 和超时设置。

Chromox
Chromox

Chromox是一款领先的AI在线生成平台,专为喜欢AI生成技术的爱好者制作的多种图像、视频生成方式的内容型工具平台。

下载
  • 必须设 Content-Type: application/json,且 JSON body 中 common.app_id 必须与控制台创建的应用 ID 一致
  • cURL 需启用 SSL 验证:curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, true)(讯飞证书有效,禁用会报错)
  • 讯飞 WebAPI 响应较慢(尤其长音频),建议设 CURLOPT_TIMEOUT => 30,并检查 CURLOPT_CONNECTTIMEOUT
  • 务必检查返回状态码:curl_getinfo($ch, CURLINFO_HTTP_CODE) !== 200 时,响应体可能是纯文本错误(如 {"code":10203,"message":"audio format error"}),不是 JSON

PHP 解析讯飞返回的 WebSocket 流式结果还是 HTTP JSON?

讯飞语音识别 WebAPI 是 HTTP 接口(非 WebSocket),返回的是完整 JSON,不是流式 chunk。但要注意:它只支持「一句话」识别(最长 60 秒),不支持长音频分片上传。若音频超时或识别中断,返回中 data.result.sn 可能为空,或 code0data.result.ws 是空数组。

立即学习PHP免费学习笔记(深入)”;

  • 成功响应结构示例:
    {"code":0,"message":"success","data":{"result":{"sn":1,"ls":true,"bg":0,"ed":1234,"ws":[{"cw":[{"w":"今天"}]},{"cw":[{"w":"天气"}]}]}}}
  • 提取文字要遍历 $resp->data->result->ws,拼接每个 ws[i]->cw[0]->w
  • 如果音频静音或信噪比低,可能返回 code: 0ws 为空——这不是接口错误,是识别失败,需前端提示用户重录
  • 讯飞不提供服务端音频降噪,预处理(如用 SoX 滤除底噪)得在 PHP 调用前完成
实际集成中最容易卡在音频格式和签名生成两处,尤其是 Windows 下 ffmpeg 路径空格、Linux 下时区导致时间戳偏差,这些细节比写逻辑更耗时间。

相关文章

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

457

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

547

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

335

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

887

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

462

2024.06.27

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

455

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.4万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号