InputStream读取需循环处理返回值以防数据不全,OutputStream写入后须flush或close确保落盘;文件流不处理编码,内存流适合中间转换。

InputStream 读取字节时为什么总读不到完整数据?
因为 InputStream.read() 默认只尝试读一个字节,返回实际读到的字节数(可能为 -1 表示 EOF,也可能远小于预期),不是“保证读满”。直接循环调用 read() 单字节效率极低,且容易漏处理返回值为 0 的边界情况(某些实现如 ByteArrayInputStream 在流末尾可能返回 0 而非 -1)。
- 用
read(byte[] b)或read(byte[] b, int off, int len)批量读取,减少系统调用次数 - 必须检查返回值:若返回
-1,立即退出循环;若返回0,需确认是否是底层流的合法行为(如PipedInputStream可能短暂返回 0) - 不要假设一次
read()就能读完全部内容——网络流、管道流尤其不可靠
byte[] buffer = new byte[8192];
int n;
while ((n = inputStream.read(buffer)) != -1) {
outputStream.write(buffer, 0, n); // 写入实际读到的 n 字节
}
OutputStream.write() 后文件为空或内容不全?
根本原因是未调用 flush() 或 close()。很多 OutputStream 实现(如 BufferedOutputStream、FileOutputStream 在部分 JDK 版本中)会缓冲写入数据,直到缓冲区满、显式刷新或流关闭才真正落盘。
- 写完关键数据后,调用
outputStream.flush()强制写出缓冲区内容 -
close()会自动调用flush(),但仅在确定不再写入时才调用 - 使用 try-with-resources 是最稳妥的方式,确保
close()必然执行
try (FileOutputStream fos = new FileOutputStream("out.bin");
BufferedOutputStream bos = new BufferedOutputStream(fos)) {
bos.write(data);
bos.flush(); // 确保数据已写入底层流
} // 自动 close → flush → 释放资源
FileInputStream / FileOutputStream 直接操作文件有哪些坑?
它们不处理字符编码,只按原始字节读写;且默认不支持追加模式(FileOutputStream 构造函数第二个参数决定是否追加);路径错误时抛 FileNotFoundException 而非静默失败。
- 写文件前确认父目录存在:
new File(path).getParentFile().mkdirs() - 需要追加时,显式传
true:new FileOutputStream(file, true) - 读文本文件别用它直接转 String——字节到字符串必须指定编码,否则依赖平台默认编码(Windows 是 GBK,Linux/macOS 是 UTF-8),极易乱码
- 大文件避免一次性
readAllBytes()(JDK 9+),内存压力大;优先用流式分块处理
什么时候该用 ByteArrayInputStream / ByteArrayOutputStream?
它们把内存当“假设备”来用,适合中间转换场景:比如把一段字节临时当输入源解析,或收集多个输出片段再统一处理。但注意——ByteArrayOutputStream 的 toByteArray() 返回的是内部数组副本(JDK 7+),而 size() 才是真实写入长度。
立即学习“Java免费学习笔记(深入)”;
- 构造
ByteArrayInputStream后,流位置从 0 开始;多次读不会自动重置,需手动reset()(前提是构造时未禁用 mark) -
ByteArrayOutputStream底层数组会动态扩容,频繁写小数据可能触发多次Arrays.copyOf(),影响性能 - 避免长期持有大
ByteArrayOutputStream实例——它的字节数组不会自动 shrink,即使调用reset()
ByteArrayOutputStream baos = new ByteArrayOutputStream();
baos.write("hello".getBytes(StandardCharsets.UTF_8));
byte[] raw = baos.toByteArray(); // 安全拷贝,长度 = baos.size()
实际用流,核心就两件事:**读要判返回值,写要记得 flush**。其他所有封装(Buffered、Data、Object 流)都是在这基础上加的糖或限制,别被名字带偏——先搞懂底层字节怎么进、怎么出,再谈上层抽象。










