新手需完成五步操作:一、邮箱注册并验证账户;二、在Text to Speech界面粘贴文本并选“Stable”语音;三、调整Stability(70–85)、Clarity(65–75)及Style Exaggeration(0.3–0.5);四、点击生成并下载MP3音频;五、长脚本可用控制台脚本批量提交。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您希望使用ElevenLabs为视频、播客或课件生成接近真人语调的配音,但尚未熟悉其界面与基础流程,则可能是由于未掌握账户配置、语音选择与音频导出的关键操作节点。以下是完成自然配音生成的完整新手操作路径:
一、注册并验证ElevenLabs账户
新用户需通过邮箱创建账户,并完成邮箱验证以解锁基础语音生成权限。未验证账户仅允许试听样例,无法下载生成音频。
1、访问 elevenlabs.io 官网,点击右上角“Sign Up”按钮。
2、输入有效邮箱地址与密码,完成图形验证码后点击“Create Account”。
3、登录邮箱查收来自 no-reply@elevenlabs.io 的验证邮件,点击其中的蓝色“Verify Email”链接。
二、导入文本并选择目标语音模型
ElevenLabs提供多种预设语音(如Bella、Antoni、Josh等),不同语音在语速、停顿节奏与情感倾向上存在差异;新手应优先选用标有“Stable”标签的语音以保障发音一致性。
1、登录后进入Dashboard,点击左侧菜单栏的“Text to Speech”选项。
2、在中央文本框中粘贴待配音的纯文字内容,确保无Markdown格式、无特殊控制符。
3、在右侧“Voice”下拉菜单中,展开“Popular Voices”分类,选择名称后带有“Stable”标识的语音(例如“Bella (Stable)”)。
三、调整语调与语速参数
默认参数适用于通用朗读场景,但自然感提升依赖对语调曲线与语速微调的干预;过高语速或过低音高易导致机械感增强。
1、在“Voice Settings”区域,将Stability滑块设为70–85(数值越高,发音越稳定,但略失灵动)。
2、将Clarity + Similarity Enhancement滑块设为65–75(平衡清晰度与人声相似度)。
3、点击“Advanced Settings”,将Style Exaggeration设为0.3–0.5,避免语气过度戏剧化。
四、生成并下载音频文件
生成过程依赖服务器实时合成,单次请求响应时间通常为3–8秒;音频格式默认为MP3,采样率固定为44.1kHz,无需额外转换即可嵌入多数剪辑软件。
1、确认文本、语音及参数设置无误后,点击界面中央的“Generate Speech”蓝色按钮。
2、等待进度条填充完毕,出现播放图标与“Download”按钮后,将鼠标悬停于音频波形图上。
3、点击波形图右下角的向下箭头图标,选择“MP3”格式,保存至本地设备指定文件夹。
五、批量生成多段配音的替代操作法
当需为长脚本分段配音(如每段≤300字符)时,手动逐次提交效率低下;可利用浏览器控制台执行轻量脚本实现自动连续提交,规避页面刷新导致的上下文丢失。
1、在Text to Speech页面打开浏览器开发者工具(Windows按F12,Mac按Cmd+Option+I),切换至“Console”标签页。
2、粘贴以下代码并回车执行:document.querySelector('textarea').value = "第一段文字"; document.querySelector('button[data-testid="generate-button"]').click();
3、待首段生成完成后,在Console中修改引号内文字为第二段内容,再次执行同一行命令,重复至全部段落完成。










