0

0

Java如何通过网络传输实时音频 Java Socket实现语音聊天功能【实例】

星降

星降

发布时间:2026-01-19 14:43:02

|

735人浏览过

|

来源于php中文网

原创

Java Socket传音频卡顿或无声的根本原因是缺乏协议层:需添加长度前缀+ WAV封装,两端硬编码统一音频格式,并用独立线程+阻塞队列实现恒定延迟缓冲,否则TCP粘包、无帧边界、AudioInputStream不兼容裸PCM等问题必然导致失败。

java如何通过网络传输实时音频 java socket实现语音聊天功能【实例】

Java Socket 传音频为什么容易卡顿或无声

直接用 Socket 原生传输原始音频(如 PCM)几乎必然出问题:没有帧边界、无采样率/位深协商、TCP 粘包导致解码错位,客户端拿到的 byte[] 根本无法喂给 AudioInputStream。这不是代码写得不够多,而是协议层缺失。

  • Java 的 AudioSystem.getAudioInputStream() 要求输入流有合法头信息(如 WAV 头),裸 PCM 流不满足
  • TCP 不保证“一次 write() 对应一次 read()”,InputStream.read(byte[]) 可能只读到半帧音频
  • 未做缓冲控制时,SourceDataLine.write() 写入过快会抛 IllegalArgumentException: Invalid audio format

必须加上的最小协议层:长度前缀 + WAV 封装

绕过复杂编解码,最简可行方案是:发送端把每块音频数据(例如 20ms 的 PCM)封装成内存中的 WAV 格式,并在 TCP 流头部写入该 WAV 数据的总长度(4 字节 int)。接收端先读 4 字节,再按长度读取完整 WAV 块,交给 AudioSystem.getAudioInputStream() 播放。

关键点:

  • WAV 封装只需构造 RIFF/WAVE 头 + data chunk,无需写完整标准头(可省略 fact、cue 等)
  • 采样率、声道数、位深必须在两端硬编码一致,例如 new AudioFormat(8000, 16, 1, true, false)
  • 发送端每次 OutputStream.write() 前,先 DataOutputStream.writeInt(wavBytes.length)
public static byte[] pcmToWav(byte[] pcm, AudioFormat format) {
    int frameSize = format.getFrameSize();
    int sampleRate = (int) format.getSampleRate();
    int channelCount = format.getChannels();
    int bitDepth = format.getSampleSizeInBits();
    int byteLength = pcm.length;
    int dataSize = byteLength;
    int wavLength = 44 + dataSize;
byte[] wav = new byte[wavLength];
// RIFF header
wav[0] = 'R'; wav[1] = 'I'; wav[2] = 'F'; wav[3] = 'F';
wav[4] = (byte) (wavLength & 0xff);
wav[5] = (byte) ((wavLength >> 8) & 0xff);
wav[6] = (byte) ((wavLength >> 16) & 0xff);
wav[7] = (byte) ((wavLength >> 24) & 0xff);
// WAVE header
wav[8] = 'W'; wav[9] = 'A'; wav[10] = 'V'; wav[11] = 'E';
// fmt chunk
wav[12] = 'f'; wav[13] = 'm'; wav[14] = 't'; wav[15] = ' ';
wav[16] = 16; wav[17] = 0; wav[18] = 0; wav[19] = 0; // subchunk1 size
wav[20] = 1; wav[21] = 0; // audio format (PCM=1)
wav[22] = (byte) channelCount;
wav[23] = (byte) (channelCount >> 8);
wav[24] = (byte) (sampleRate & 0xff);
wav[25] = (byte) ((sampleRate >> 8) & 0xff);
wav[26] = (byte) ((sampleRate >> 16) & 0xff);
wav[27] = (byte) ((sampleRate >> 24) & 0xff);
int byteRate = sampleRate * channelCount * bitDepth / 8;
wav[28] = (byte) (byteRate & 0xff);
wav[29] = (byte) ((byteRate >> 8) & 0xff);
wav[30] = (byte) ((byteRate >> 16) & 0xff);
wav[31] = (byte) ((byteRate >> 24) & 0xff);
wav[32] = (byte) (channelCount * bitDepth / 8); // block align
wav[33] = 0;
wav[34] = (byte) bitDepth; // bits per sample
wav[35] = 0;
// data chunk
wav[36] = 'd'; wav[37] = 'a'; wav[38] = 't'; wav[39] = 'a';
wav[40] = (byte) (dataSize & 0xff);
wav[41] = (byte) ((dataSize >> 8) & 0xff);
wav[42] = (byte) ((dataSize >> 16) & 0xff);
wav[43] = (byte) ((dataSize >> 24) & 0xff);
// copy PCM
System.arraycopy(pcm, 0, wav, 44, dataSize);
return wav;

}

立即学习Java免费学习笔记(深入)”;

讯飞智作-虚拟主播
讯飞智作-虚拟主播

讯飞智作是一款集AI配音、虚拟人视频生成、PPT生成视频、虚拟人定制等多功能的AI音视频生产平台。已广泛应用于媒体、教育、短视频等领域。

下载

录音与播放线程必须独立且带缓冲队列

不能让录音线程直接往 Socket.getOutputStream() 写,也不能让网络接收线程直接调用 SourceDataLine.write() —— 实时性依赖固定延迟缓冲,不是越快越好。

  • 录音端:用 TargetDataLine.read() 采集固定大小(如 320 字节对应 20ms @8kHz/16bit/mono)到 BlockingQueue,另起线程从队列取数据、封装 WAV、加长度头、发送
  • 播放端:网络线程收到完整 WAV 块后,放入另一个 BlockingQueue;播放线程以恒定速率(如每 20ms 取一块)从队列取数据,用 AudioSystem.getAudioInputStream(new ByteArrayInputStream(wavBytes)) 解析并写入 SourceDataLine
  • 队列容量建议设为 3–5,过大会增加端到端延迟,过小易触发丢包或爆音

实际跑通前必须验证的三件事

很多“能连上但没声音”的问题,根源不在网络或音频 API,而在底层假设被打破。

  • 确认麦克风权限:Linux 下需 sudo usermod -a -G audio $USER;Windows 上检查 Java 是否被静音策略拦截
  • 确认音频格式兼容:AudioSystem.isLineSupported(info) 必须返回 true,尤其注意 AudioFormat.Encoding.PCM_SIGNED 和字节序(bigEndian=false
  • 确认 Socket 阻塞行为:服务端 ServerSocket.accept() 后,立即对 Socket.getInputStream()Socket.getOutputStream() 调用 setSoTimeout(5000),避免某端异常断连时另一端永久阻塞

真正难的不是写完代码,而是让两台机器上不同版本 JRE 的音频子系统,在无额外库前提下,对同一段二进制流达成完全一致的时序解释——这要求所有参数、缓冲策略、线程调度节奏全部显式控制,不能依赖任何“默认”。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

837

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

741

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

737

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

399

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16926

2023.08.03

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

0

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号