【百度AI语音合成】会员到访门店语音提醒

蓮花仙者

发布时间：2025-07-22 11:48:01

403人浏览过

来源于php中文网

原创

实现步骤 step1: 成为百度 ai开放平台的开发者

【百度AI语音合成】会员到访门店语音提醒

我们有账号后登录，并点击此处（百度语音）创建一个应用，如下图所示。

【百度AI语音合成】会员到访门店语音提醒

然后就可以看到创建完成的应用和 APPID、API KEY 以及 Secret KEY。

【百度AI语音合成】会员到访门店语音提醒

Step2: 准备数据

语音合成是将文本转换为可播放的音频文件的服务，我们从大姚的订单库中找到一段订单信息文本如下：

三分钟前，由北京市顺义区二经路与二纬路交汇处北侧，北京首都国际机场T3航站楼去往东城区北三环东路36号喜来登大酒店(北京金隅店)

Step3: 编写一个语音合成示例程序

有了第一步的 API KEY 以及 Secret KEY，以及第二步的数据，我们就可以编写一个示例代码来调用百度AI开放平台的文字识别功能。

准备开发环境

小帅选择使用Java来快速搭建一个原型，关于如何安装Java，可以参考百度经验哦。百度AI提供了非常完善的API文档和封装调用更方便的工具包。接下来小帅将使用Maven来搭建工程环境。

pom.xml配置如下：

<dependency>
    <groupId>com.baidu.aip</groupId>
    <artifactId>java-sdk</artifactId>
    <version>4.12.0</version>
</dependency>

编写代码

粘贴以下内容，不要忘记替换你的 APPID、APIKEY 以及 SECRETKEY 和图片文件。

运行main方法即可。

import com.baidu.aip.speech.AipSpeech;
import com.baidu.aip.speech.TtsResponse;
import com.baidu.aip.util.Util;
import org.json.JSONObject;
import java.util.HashMap;
<p>public class Sample {
//第一步创建应用获取的三个值
private static String APPID = "你的 App ID";
private static String APIKEY = "你的 Api Key";
private static String SECRETKEY = "你的 Secret Key";</p><pre class="brush:php;toolbar:false;"><code>public static void main(String[] args) {
    // 初始化一个AipSpeech 
    AipSpeech client = new AipSpeech(APPID, APIKEY, SECRETKEY);

    // 调用接口 第二步准备的图片
    HashMap<String, Object> options = new HashMap();

    //合成的文本内容
    String text = "三分钟前，由北京市顺义区二经路与二纬路交汇处北侧，北京首都国际机场T3航站楼 去往 东城区北三环东路36号喜来登大酒店(北京金隅店)";

    //发音人选择
    /**
     * 度小宇=1，度小美=0，度逍遥=3，度丫丫=4
     * 度博文=106，度小童=110，度小萌=111，度米朵=103，度小娇=5
     **/
    options.put("per", "0");

    //语速，取值0-9，默认为5中语速
    options.put("spd", "3");

    TtsResponse res = client.synthesis(text, "zh", 1, options);
    byte[] data = res.getData();
    JSONObject res1 = res.getResult();

    if (data != null) {
        try {
            Util.writeBytesToFileSystem(data, "F:\testaudio\度小美Demooutput.mp3");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    if (res1 != null) {
        System.out.println(res1.toString());
    }
}

}

保存接口返回语音byte[] 转存为MP3格式文件。这里说明一下，默认返回就是MP3格式的数据哦。如果想要其他格式：

//3为mp3格式(默认)；
//4为pcm-16k；
//5为pcm-8k；
//6为wav（内容同pcm-16k）;
//注意aue=4或者6是语音识别要求的格式，但是音频内容不是语音识别要求的自然人发音，所以识别效果会受影响。
options.put("aue", "3");

点击访问合成的示例MP3文件。

语音合成单例加载。10次测试耗时如下(单位:ms(毫秒))。第一次需要加载一次AUTH。耗时多了一些。后续基本都持平在710ms以内。

发送请求到返回数据耗时:1493
发送请求到保存文件耗时:1495
发送请求到返回数据耗时:611
发送请求到保存文件耗时:612
发送请求到返回数据耗时:609
发送请求到保存文件耗时:610
发送请求到返回数据耗时:473
发送请求到保存文件耗时:474
发送请求到返回数据耗时:549
发送请求到保存文件耗时:550
发送请求到返回数据耗时:673
发送请求到保存文件耗时:674
发送请求到返回数据耗时:754
发送请求到保存文件耗时:755
发送请求到返回数据耗时:676
发送请求到保存文件耗时:676
发送请求到返回数据耗时:582
发送请求到保存文件耗时:582
发送请求到返回数据耗时:662
发送请求到保存文件耗时:663
发送请求到返回数据平均耗时:708.2ms
发送请求到保存文件平均耗时:709.1ms

for (int i = 0; i < 10; i++) {
options = new HashMap<String, Object>();
options.put("per", "0");
options.put("spd", "3");
long startTime = System.currentTimeMillis();
TtsResponse res = client.synthesis(text, "zh", 1, options);
byte[] data = res.getData();
if (data != null) {
long endTime = System.currentTimeMillis();
System.out.println("发送请求到返回数据耗时:" + (endTime - startTime));
try {
Util.writeBytesToFileSystem(data, "F:	estaudio度小美Demooutput.mp3");
long saveEndTime = System.currentTimeMillis();
System.out.println("发送请求到保存文件耗时:" + (saveEndTime - startTime));
} catch (IOException e) {
e.printStackTrace();
}
}
JSONObject res1 = res.getResult();
if (res1 != null) {
System.out.println(res1.toString());
}
System.out.println();
}

【百度AI语音合成】会员到访门店语音提醒

百宝箱

百宝箱是支付宝推出的一站式AI原生应用开发平台，无需任何代码基础，只需三步即可完成AI应用的创建与发布。

下载

会员到访语音提醒搞起来，简单看一下业务流程图。主要看语音合成、语音提醒部分即可。

人脸会员识别可以看百度AI的官方解决方案 https://www.php.cn/link/bce15390acb84d49e513cb3f2963c523

本业务中人脸识别、摄像头厂商暂时没用百度AI。这一点我也很无奈。迫于公司要求呀。如果再来一次选择，绝对强制提议选择百度AI(怕太便宜而告终你懂得)。

【百度AI语音合成】会员到访门店语音提醒

接口调用封装，并符合业务系统使用。

会员信息采集

【百度AI语音合成】会员到访门店语音提醒

后端会员人脸信息处理

/** </p><ul><li>会员人脸信息添加 </li><li>@param csFace </li><li>@return 
*/
@AutoLog(value = "会员人脸信息添加")
@ApiOperation(value="会员人脸信息添加", notes="会员人脸信息添加")
@PostMapping(value = "/add")
public Result<CsFace> add(@RequestBody CsFace csFace) {
Result<CsFace> result = new Result<CsFace>();
CsFaceGroup group = new CsFaceGroup();
try {
//这里存人脸信息到人脸库就不演示了。人脸库存入成功后业务系统再记录
csFaceService.save(csFace);
//把会员人脸信息提交给JOB等待后续执行。方便前端页面交互不等待
//人脸会员信息只是在一个JobFace类中增加一个List容器
public static List<CsFace> vipFaceMap = new ArrayList<CsFace>();
JobFace.vipFaceMap.add(csFace);
result.success("添加成功！");
} catch (Exception e) {
log.info(e.getMessage());
result.error500("操作失败-人脸服务存在异常");
}
return result;
}

会员到访定制提示音频合成定时任务

import cn.hutool.core.date.DatePattern;
import cn.hutool.core.date.DateUtil;
import cn.netand.common.factory.BDFactory;
import cn.netand.modules.csface.entity.CsFace;
import cn.netand.modules.csface.service.ICsFaceService;
import com.baidu.aip.speech.AipSpeech;
import com.baidu.aip.speech.TtsResponse;
import com.baidu.aip.util.Util;
import lombok.extern.slf4j.Slf4j;
import org.quartz.Job;
import org.quartz.JobExecutionContext;
import org.quartz.JobExecutionException;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.beans.factory.annotation.Value;
import java.io.File;
import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;
import java.util.HashMap;
import java.util.List;</li></ul><p>/** </p><ul><li><p>@Description 人脸会员音频生成 </p></li><li><p>@author 小帅丶 </p></li><li><p>@className VipVoiceJob  </p></li><li><p>@Date 2019/11/20 22:11 
**/
@Slf4j
public class VipVoiceJob implements Job {
@Value(value = "${xiaoshuai.path.upload}")
private String uploadpath;</p><p>@Autowired
private GeneralDealBeanUtil generalDealBeanUtil;</p><p>@Autowired
private ICsFaceService csFaceService;</p><p>//获取音频合成的客户端
AipSpeech aipSpeech = BDFactory.getAipSpeech();</p><p>@Value(value = "${xiaoshuai.domainVoice}")
private String domainVoice;</p><p>/** </p><ul><li>度小宇=1，度小美=0，度逍遥=3，度丫丫=4 </li><li>度博文=106，度小童=110，度小萌=111，度米朵=103，度小娇=5 
**/
private static final List<String> audioType = Arrays.asList("1", "0", "3", "4", "106", "110", "111", "103", "5");
private static final String LANGUAGE_ZH = "zh";
private static final Integer CTP = 1;
private static final String AUDIO = ".mp3";</li></ul><p>//任务执行详情
@Override
public void execute(JobExecutionContext jobExecutionContext) throws JobExecutionException {
System.out.println("execute VipVoiceJob = " + DateUtil.format(new Date(), DatePattern.NORM_DATETIME_PATTERN));
List<CsFace> vipFaceMap = JobFace.vipFaceMap;
int vipFaceSize = vipFaceMap.size();
if (vipFaceSize > 0) {
vipFaceMap.forEach(csFace -> {
//获取会员信息
try {
generalAudio(csFace);
csFace.setVoiceStatus(1);
csFaceService.updateById(csFace);
} catch (Exception e) {
System.out.println(e.getMessage());
csFace.setVoiceStatus(2);
csFaceService.updateById(csFace);
}
});
JobFace.vipFaceMap.clear();
}
}</p><p>/** </p><ul><li>@Description 生成全部音库音频文件 </li><li>@Author 小帅丶 </li><li>@Date  2019/11/20 23:28 </li><li>@param face 会员人脸数据 </li><li>@return void 
**/
public void generalAudio(CsFace face) {
String ctxPath = uploadpath;
String bizPath = "audios";
File file = new File(ctxPath + File.separator + bizPath + File.separator + face.getId());
if (!file.exists()) {
file.mkdirs();// 创建文件根目录
}
long startTime = System.currentTimeMillis();
audioType.forEach(audioTypeStr -> {
HashMap<String, Object> options = new HashMap();
//合成的文本内容
String text = "XX门店提醒 " + face.getName() + " 会员到访";
//发音人选择
options.put("per", audioTypeStr);
//语速，取值0-9，默认为5中语速
options.put("spd", "3");
String fileName = audioTypeStr + AUDIO;
TtsResponse response = aipSpeech.synthesis(text, LANGUAGE_ZH, CTP, options);
byte[] data = response.getData();
if (data != null) {
try {
String savePath = file.getPath() + File.separator + fileName;
String filePath = bizPath + File.separator + face.getId() + File.separator + fileName;
if (null != face.getVoiceType() && face.getVoiceType().equals(Integer.parseInt(audioTypeStr))) {
filePath = filePath.replace("", "/");
face.setVoicePath(filePath);
face.setVoiceUrl(domainVoice + filePath);
}
Util.writeBytesToFileSystem(data, savePath);
} catch (Exception e) {
System.out.println(e.getMessage());
}
}
});
long endTime = System.currentTimeMillis();
System.out.println("总耗时 = " + (endTime - startTime) + "ms");
}
}

添加一条定时任务

【百度AI语音合成】会员到访门店语音提醒