Java合并WAV必须校验并统一所有文件的PCM参数(采样率、位深、声道等),仅拼接data块并重写RIFF头部长度字段;若格式不一致需重采样或拒绝合并,推荐用ffmpeg替代手动字节操作。

Java 合并多个 WAV 文件的底层限制必须先认清
WAV 是 RIFF 容器格式,头部包含 fmt 子块(音频格式)和 data 子块(原始采样数据)。Java 标准库 javax.sound.sampled 能读取/写入单个 WAV,但不支持直接拼接多个文件——因为合并不是简单字节追加,必须校验并统一所有文件的音频参数(采样率、位深度、声道数),且要重写最终的 RIFF 头部长度字段。跳过校验直接拼接会导致播放失败或杂音。
用 AudioSystem 检查并标准化所有 WAV 的音频格式
必须确保所有输入文件是同格式 PCM,否则无法无损拼接。以下检查逻辑不可省略:
-
AudioFormat.getEncoding()必须为AudioFormat.Encoding.PCM_SIGNED -
AudioFormat.getSampleRate()、getSampleSizeInBits()、getChannels()、getFrameRate()、getFrameSize()全部一致 - 若发现不一致,需用重采样(如 TarsosDSP)或拒绝合并,不能强行写入
示例校验代码:
for (File file : wavFiles) {
AudioInputStream ais = AudioSystem.getAudioInputStream(file);
AudioFormat format = ais.getFormat();
if (!format.getEncoding().equals(AudioFormat.Encoding.PCM_SIGNED)) {
throw new IllegalArgumentException("Only PCM_SIGNED WAV supported: " + file);
}
if (!format.equals(firstFormat)) { // firstFormat 来自第一个文件
throw new IllegalArgumentException("Format mismatch at " + file + ": " + format);
}
}
手动拼接 data 块并重写 RIFF 头部长度字段
WAV 文件结构是:"RIFF" + 4-byte length + "WAVE" + fmt-chunk + data-chunk。拼接时只取第一个文件的 RIFF 头 + fmt 块,再把所有文件的 data 块内容顺序追加,最后更新总长度字段(从第 4 字节开始的 4 字节小端整数)。
立即学习“Java免费学习笔记(深入)”;
- 不能用
AudioSystem.write()直接写多段流——它会为每段生成独立头部 - 必须用
FileInputStream读原始字节,跳过前 44 字节(标准头大小),提取fmt块(通常 24 字节,但需按 chunk size 解析) - 最终文件总长度 = 4("RIFF")+ 4(length field)+ 4("WAVE")+ fmtChunk.length + 所有 data 块字节总和
关键字节操作示例(简化版):
byte[] riffHeader = readFirstWavHeader(firstWav); // 读前 12 字节确认 "RIFFxxxxWAVE" byte[] fmtChunk = extractFmtChunk(firstWav); // 从第一个文件中完整提取 fmt 子块 long totalDataBytes = 0; for (File f : wavFiles) totalDataBytes += getDataLength(f); // 跳过头,读 data chunk size int totalLength = 4 + 4 + 4 + fmtChunk.length + (int)totalDataBytes; riffHeader[4] = (byte)(totalLength & 0xFF); riffHeader[5] = (byte)((totalLength >> 8) & 0xFF); riffHeader[6] = (byte)((totalLength >> 16) & 0xFF); riffHeader[7] = (byte)((totalLength >> 24) & 0xFF); // 小端写入 length 字段
绕过手动字节操作的替代方案:用 JAVE 或 ffmpeg CLI
如果项目允许引入外部依赖或命令行工具,比手写 RIFF 解析更可靠:
-
JAVE (Java Audio Video Encoder)底层调用 ffmpeg,支持 WAV 拼接,但需注意其MultiInputAudioAttributes对 WAV 支持有限,建议转为临时 MP3 再合并回 WAV - 更稳的方式是调用系统
ffmpeg:ffmpeg -i "concat:file1.wav|file2.wav|file3.wav" -c copy output.wav—— 这要求所有输入严格同格式,且 ffmpeg 版本 ≥ 4.1 - Java 中用
Runtime.getRuntime().exec()调用时,务必检查ffmpeg是否在 PATH,并捕获stderr判断是否因格式不匹配失败
纯 Java 方案看似“干净”,但 RIFF 头解析稍有偏差(比如忽略可能存在的 LIST 或 fact 块)就会导致文件损坏;生产环境建议优先走 ffmpeg 路径。










