0

0

【百度AI语音合成】会员到访门店语音提醒

蓮花仙者

蓮花仙者

发布时间:2025-07-22 11:48:01

|

403人浏览过

|

来源于php中文网

原创

实现步骤 step1: 成为百度ai开放平台的开发者

【百度AI语音合成】会员到访门店语音提醒

我们有账号后登录,并点击此处(百度语音)创建一个应用,如下图所示。

【百度AI语音合成】会员到访门店语音提醒

然后就可以看到创建完成的应用和 APPID、API KEY 以及 Secret KEY。

【百度AI语音合成】会员到访门店语音提醒

Step2: 准备数据

语音合成是将文本转换为可播放的音频文件的服务,我们从大姚的订单库中找到一段订单信息文本如下:

三分钟前,由北京市顺义区二经路与二纬路交汇处北侧,北京首都国际机场T3航站楼 去往 东城区北三环东路36号喜来登大酒店(北京金隅店)

Step3: 编写一个语音合成示例程序

有了第一步的 API KEY 以及 Secret KEY,以及第二步的数据,我们就可以编写一个示例代码来调用百度AI开放平台的文字识别功能。

准备开发环境

小帅选择使用Java来快速搭建一个原型,关于如何安装Java,可以参考百度经验哦。百度AI提供了非常完善的API文档和封装调用更方便的工具包。接下来小帅将使用Maven来搭建工程环境。

pom.xml配置如下:


    com.baidu.aip
    java-sdk
    4.12.0

编写代码

粘贴以下内容,不要忘记替换你的 APPID、APIKEY 以及 SECRETKEY 和 图片文件。

运行main方法即可。

import com.baidu.aip.speech.AipSpeech;
import com.baidu.aip.speech.TtsResponse;
import com.baidu.aip.util.Util;
import org.json.JSONObject;
import java.util.HashMap;

public class Sample { //第一步创建应用获取的三个值 private static String APPID = "你的 App ID"; private static String APIKEY = "你的 Api Key"; private static String SECRETKEY = "你的 Secret Key";

public static void main(String[] args) {
    // 初始化一个AipSpeech 
    AipSpeech client = new AipSpeech(APPID, APIKEY, SECRETKEY);

    // 调用接口 第二步准备的图片
    HashMapzuojiankuohaophpcnString, Objectyoujiankuohaophpcn options = new HashMap();

    //合成的文本内容
    String text = "三分钟前,由北京市顺义区二经路与二纬路交汇处北侧,北京首都国际机场T3航站楼 去往 东城区北三环东路36号喜来登大酒店(北京金隅店)";

    //发音人选择
    /**
     * 度小宇=1,度小美=0,度逍遥=3,度丫丫=4
     * 度博文=106,度小童=110,度小萌=111,度米朵=103,度小娇=5
     **/
    options.put("per", "0");

    //语速,取值0-9,默认为5中语速
    options.put("spd", "3");

    TtsResponse res = client.synthesis(text, "zh", 1, options);
    byte[] data = res.getData();
    JSONObject res1 = res.getResult();

    if (data != null) {
        try {
            Util.writeBytesToFileSystem(data, "F:\\testaudio\\度小美Demooutput.mp3");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    if (res1 != null) {
        System.out.println(res1.toString());
    }
}

}

保存接口返回语音byte[] 转存为MP3格式文件。这里说明一下,默认返回就是MP3格式的数据哦。如果想要其他格式:

//3为mp3格式(默认);
//4为pcm-16k;
//5为pcm-8k;
//6为wav(内容同pcm-16k);
//注意aue=4或者6是语音识别要求的格式,但是音频内容不是语音识别要求的自然人发音,所以识别效果会受影响。
options.put("aue", "3");

点击访问合成的示例MP3文件。

语音合成单例加载。10次测试耗时如下(单位:ms(毫秒))。第一次需要加载一次AUTH。耗时多了一些。后续基本都持平在710ms以内。

发送请求到返回数据耗时:1493
发送请求到保存文件耗时:1495
发送请求到返回数据耗时:611
发送请求到保存文件耗时:612
发送请求到返回数据耗时:609
发送请求到保存文件耗时:610
发送请求到返回数据耗时:473
发送请求到保存文件耗时:474
发送请求到返回数据耗时:549
发送请求到保存文件耗时:550
发送请求到返回数据耗时:673
发送请求到保存文件耗时:674
发送请求到返回数据耗时:754
发送请求到保存文件耗时:755
发送请求到返回数据耗时:676
发送请求到保存文件耗时:676
发送请求到返回数据耗时:582
发送请求到保存文件耗时:582
发送请求到返回数据耗时:662
发送请求到保存文件耗时:663
发送请求到返回数据平均耗时:708.2ms
发送请求到保存文件平均耗时:709.1ms
for (int i = 0; i < 10; i++) {
options = new HashMap();
options.put("per", "0");
options.put("spd", "3");
long startTime = System.currentTimeMillis();
TtsResponse res = client.synthesis(text, "zh", 1, options);
byte[] data = res.getData();
if (data != null) {
long endTime = System.currentTimeMillis();
System.out.println("发送请求到返回数据耗时:" + (endTime - startTime));
try {
Util.writeBytesToFileSystem(data, "F:\testaudio\度小美Demooutput.mp3");
long saveEndTime = System.currentTimeMillis();
System.out.println("发送请求到保存文件耗时:" + (saveEndTime - startTime));
} catch (IOException e) {
e.printStackTrace();
}
}
JSONObject res1 = res.getResult();
if (res1 != null) {
System.out.println(res1.toString());
}
System.out.println();
}

【百度AI语音合成】会员到访门店语音提醒

会员到访语音提醒搞起来,简单看一下业务流程图。主要看语音合成、语音提醒部分即可。

Runway
Runway

Runway是一个AI创意工具平台,它提供了一系列强大的功能,旨在帮助用户在视觉内容创作、设计和开发过程中提高效率和创新能力。

下载

人脸会员识别可以看百度AI的官方解决方案 https://www.php.cn/link/bce15390acb84d49e513cb3f2963c523

本业务中人脸识别、摄像头厂商暂时没用百度AI。这一点我也很无奈。迫于公司要求呀。如果再来一次选择,绝对强制提议选择百度AI(怕太便宜而告终 你懂得)。

【百度AI语音合成】会员到访门店语音提醒

接口调用封装,并符合业务系统使用。

会员信息采集

【百度AI语音合成】会员到访门店语音提醒【百度AI语音合成】会员到访门店语音提醒【百度AI语音合成】会员到访门店语音提醒

后端会员人脸信息处理

/** 

  • 会员人脸信息添加
  • @param csFace
  • @return */ @AutoLog(value = "会员人脸信息添加") @ApiOperation(value="会员人脸信息添加", notes="会员人脸信息添加") @PostMapping(value = "/add") public Result add(@RequestBody CsFace csFace) { Result result = new Result(); CsFaceGroup group = new CsFaceGroup(); try { //这里存人脸信息到人脸库就不演示了。人脸库存入成功后业务系统再记录 csFaceService.save(csFace); //把会员人脸信息提交给JOB等待后续执行。方便前端页面交互不等待 //人脸会员信息只是在一个JobFace类中增加一个List容器 public static List vipFaceMap = new ArrayList(); JobFace.vipFaceMap.add(csFace); result.success("添加成功!"); } catch (Exception e) { log.info(e.getMessage()); result.error500("操作失败-人脸服务存在异常"); } return result; }

会员到访定制提示音频合成定时任务

import cn.hutool.core.date.DatePattern;
import cn.hutool.core.date.DateUtil;
import cn.netand.common.factory.BDFactory;
import cn.netand.modules.csface.entity.CsFace;
import cn.netand.modules.csface.service.ICsFaceService;
import com.baidu.aip.speech.AipSpeech;
import com.baidu.aip.speech.TtsResponse;
import com.baidu.aip.util.Util;
import lombok.extern.slf4j.Slf4j;
import org.quartz.Job;
import org.quartz.JobExecutionContext;
import org.quartz.JobExecutionException;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.beans.factory.annotation.Value;
import java.io.File;
import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;
import java.util.HashMap;
import java.util.List;

/**

  • @Description 人脸会员音频生成

  • @author 小帅丶

  • @className VipVoiceJob

  • @Date 2019/11/20 22:11 **/ @Slf4j public class VipVoiceJob implements Job { @Value(value = "${xiaoshuai.path.upload}") private String uploadpath;

    @Autowired private GeneralDealBeanUtil generalDealBeanUtil;

    @Autowired private ICsFaceService csFaceService;

    //获取音频合成的客户端 AipSpeech aipSpeech = BDFactory.getAipSpeech();

    @Value(value = "${xiaoshuai.domainVoice}") private String domainVoice;

    /**

    • 度小宇=1,度小美=0,度逍遥=3,度丫丫=4
    • 度博文=106,度小童=110,度小萌=111,度米朵=103,度小娇=5 **/ private static final List audioType = Arrays.asList("1", "0", "3", "4", "106", "110", "111", "103", "5"); private static final String LANGUAGE_ZH = "zh"; private static final Integer CTP = 1; private static final String AUDIO = ".mp3";

    //任务执行详情 @Override public void execute(JobExecutionContext jobExecutionContext) throws JobExecutionException { System.out.println("execute VipVoiceJob = " + DateUtil.format(new Date(), DatePattern.NORM_DATETIME_PATTERN)); List vipFaceMap = JobFace.vipFaceMap; int vipFaceSize = vipFaceMap.size(); if (vipFaceSize > 0) { vipFaceMap.forEach(csFace -> { //获取会员信息 try { generalAudio(csFace); csFace.setVoiceStatus(1); csFaceService.updateById(csFace); } catch (Exception e) { System.out.println(e.getMessage()); csFace.setVoiceStatus(2); csFaceService.updateById(csFace); } }); JobFace.vipFaceMap.clear(); } }

    /**

    • @Description 生成全部音库音频文件
    • @Author 小帅丶
    • @Date 2019/11/20 23:28
    • @param face 会员人脸数据
    • @return void **/ public void generalAudio(CsFace face) { String ctxPath = uploadpath; String bizPath = "audios"; File file = new File(ctxPath + File.separator + bizPath + File.separator + face.getId()); if (!file.exists()) { file.mkdirs();// 创建文件根目录 } long startTime = System.currentTimeMillis(); audioType.forEach(audioTypeStr -> { HashMap options = new HashMap(); //合成的文本内容 String text = "XX门店提醒 " + face.getName() + " 会员到访"; //发音人选择 options.put("per", audioTypeStr); //语速,取值0-9,默认为5中语速 options.put("spd", "3"); String fileName = audioTypeStr + AUDIO; TtsResponse response = aipSpeech.synthesis(text, LANGUAGE_ZH, CTP, options); byte[] data = response.getData(); if (data != null) { try { String savePath = file.getPath() + File.separator + fileName; String filePath = bizPath + File.separator + face.getId() + File.separator + fileName; if (null != face.getVoiceType() && face.getVoiceType().equals(Integer.parseInt(audioTypeStr))) { filePath = filePath.replace("\", "/"); face.setVoicePath(filePath); face.setVoiceUrl(domainVoice + filePath); } Util.writeBytesToFileSystem(data, savePath); } catch (Exception e) { System.out.println(e.getMessage()); } } }); long endTime = System.currentTimeMillis(); System.out.println("总耗时 = " + (endTime - startTime) + "ms"); } }

添加一条定时任务

【百度AI语音合成】会员到访门店语音提醒

会员音频提示文件生成

【百度AI语音合成】会员到访门店语音提醒

会员到访APP推送

【百度AI语音合成】会员到访门店语音提醒

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

837

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

741

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

737

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

399

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16926

2023.08.03

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号