0

0

XML在语音合成中的应用

黄舟

黄舟

发布时间:2017-03-03 17:10:12

|

2199人浏览过

|

来源于php中文网

原创

    互联网以及和它相关的一切现在似乎随处可见。您也许已经试过接到夜间电话推销员的语音电话、又或者曾经接到过当地药店给您的处方通知。现在,有一种新技术可以使用语音合成结合xml技术传送语音信息了。

 
    以语音传递信息的手段并不是什么新东西。它是我们几千年来一直使用的交流方法。而且,从一台计算机那里接收到电话也并非什么新发明。许多语音技术到现在已经大行其道了,从传真机、自动拨号器到集成语音回复系统(IVR)。电话当然是它最普遍的应用。

    传统的语音系统使用预先录制好的样本、词典和音素来创建我们所听到的声音。然而,使用这种预先录制的手段有很多问题。其中最普遍的问题之一就是缺少连贯性和变化。如果只有一种录制好的语音版本,其中每个单词或者声音都只有一个样本,那么很难让计算机发出和普通陈述语句不同语调的疑问句。同样困难的是让计算机知道何时该用某种语调或者该用何种语调发音。

    为了帮助解决语音合成问题,W3C为语音合成标记语言(Speech Synthesis Markup Language)创建了一种新的工作草稿。这种新的XML词汇表可以使语音浏览器开发人员能够控制一个语音合成器的创建方法。例如,开发者可以将命令包含进音量中,并在合成语音模式的时候使用它。

    SSML规范基于Sun公司早期的一项名为jspeeck Markup Language(JSML)的研究工作。JSML则是基于java Speech API Markup Language。现在SSML是W3C语音研究工作组的工作稿。

    SSML语言的基本目标是一个文本到语音(Text-To-Speech简称TTS)的处理器。一个TTS引擎获得一个文本的集合并将它转换为语音。现在已经有了几种TTS应用程序了,例如电话语音合成回复系统,以及为盲人设计的更高级的系统等等。特定文本集合的发音本身固有的不确定性是现有TTS系统的所面临的主要难题之一。其他普遍一点的问题集中在单词简写(如HTML)、拼写和发音不同的单词(如subpoena)等词类的发音上。

    SSML语言的基础元素指定了文本的格式。例如针对HTML,SSML语言提供了一种段落元素而且走得更远。因为它还提供了句子元素。通过像指定段落一样指定句子的地址,包括起始地址和终止地址,TTS引擎就能更精确的生成语音。

    除了基本的格式,SSML还提供了功能来指定如何发某个预定的词语或者词语集合。这个功能由“say-as”元素来实现。它是SSML中一个非常有用的组件。它能让你指定一个模板,这个模板描述如何发音某个单词或者单词集合。通过“say-as”,我们可以为缩写的单词指定如何发音,也可以为拼写与发音不同的单词指定发音。我们还可以列出数字和日期之间的区别。“say-as”元素包含了对email地址、货币和电话号码等的支持。

极限网络办公Office Automation
极限网络办公Office Automation

专为中小型企业定制的网络办公软件,富有竞争力的十大特性: 1、独创 web服务器、数据库和应用程序全部自动傻瓜安装,建立企业信息中枢 只需3分钟。 2、客户机无需安装专用软件,使用浏览器即可实现全球办公。 3、集成Internet邮件管理组件,提供web方式的远程邮件服务。 4、集成语音会议组件,节省长途话费开支。 5、集成手机短信组件,重要信息可直接发送到员工手机。 6、集成网络硬

下载

    我们也可以对文本提供一种语音学上的表达方式。例如,我们可以通过这种手段来指出美式英语和英式英语对potato单词发音的不同。

    SSML语言的几个高级属性可以帮助我们让TTS系统生成更人性化的声音。我们可以使用“voice”元素指定男声、女声或者中性的声音,而且还可以指定声音所属的年龄。我们可以使用这个元素来指定从4岁的男孩到75岁的老妇之间的任何声音。

    我们还可以使用“emphasis”元素环绕那些需要强调或者比较次要的文本。我们还可以使用“break”元素告诉系统语音在某处应该暂停。

    SSML语言最高级地特性之一体现在它地“PRosody”元素上。通过它我们可以以某种指定地方式生成某个确定的文本集合的语音。我们可以指定声音的语调、范围、语速(单词每分钟)。我们甚至可以通过使用“contour”元素指定更细节的东西。“contour”元素把语调和语速集成在了一起。通过指定一个文本集合的“contour”元素值,我们可以更精确的定义如何生成语音。

 以上就是XML在语音合成中的应用的内容,更多相关内容请关注PHP中文网(www.php.cn)!

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

2

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

2

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

0

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

0

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

3

2026.01.29

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

25

2026.01.29

clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址
clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址

clawdbot龙虾机器人官网入口:https://clawd.bot/,clawdbot ai是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

16

2026.01.29

Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

8

2026.01.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

622

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
XML教程
XML教程

共142课时 | 6万人学习

XQuery 教程
XQuery 教程

共12课时 | 3.8万人学习

XLink  教程
XLink 教程

共7课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号