Java Stream API 是数据处理管道,支持懒加载的中间操作(如filter、map、sorted)和触发执行的终端操作(如collect、forEach);不可复用,不适用于存储,慎用parallelStream。

Java Stream API 不是用来替代集合或存储数据的,它本质是一个**数据处理管道**——你把数据源“塞进去”,用一串声明式操作“加工”,最后用终端操作“取出来”或“消费掉”。能做什么?一句话:把原本要写 for 循环 + if + new ArrayList() 的事,变成可读、可链、可并行的一行逻辑。
filter、map、sorted 这些中间操作到底在干啥?
它们不立即执行,只记下“等会儿要这么处理”,属于懒加载。只有遇到 collect、forEach、count 这类终端操作时,整条链才真正跑起来。
-
filter是守门员:只放行满足Predicate条件的元素(比如n -> n % 2 == 0) -
map是翻译官:把每个元素按规则转成另一个值(比如String::length把字符串变数字) -
sorted是排序器:默认按自然序,也可传Comparator自定义(注意:对引用类型排序前确保compareTo或Comparator不抛NullPointerException)
Listnumbers = Arrays.asList(3, 1, 4, 1, 5); List evensSorted = numbers.stream() .filter(n -> n % 2 == 0) // 留下 4 .map(n -> n * 2) // 变成 8 .sorted() // 单元素,效果不显,但合法 .collect(Collectors.toList());
collect 是终点,但不是万能终点
它负责把流“收口”成你要的结果,但选错收集器会出问题:
- 想转
List?用Collectors.toList()—— 它不保证线程安全,也不保证返回的是ArrayList(可能是不可变实现) - 要唯一去重?
Collectors.toSet()更合适,但注意元素必须正确重写equals和hashCode - 聚合统计?别硬写循环:
Collectors.summingInt(Person::getAge)比手写reduce直观且不易空指针 - 千万别对空流用
Collectors.collectingAndThen(..., Objects::requireNonNull)这类包装——先判空再 collect 更稳妥
什么时候该用 parallelStream()?
不是“用了就快”,而是“大集合 + 无状态计算 + CPU 密集”才值得开并行:
立即学习“Java免费学习笔记(深入)”;
- 小列表(比如 parallelStream() 反而更慢——线程调度开销压倒收益
- 操作里有共享变量、
System.out.println、数据库连接等副作用?并行下结果不可预测,直接禁用 - 数据源本身是
LinkedList?并行性能可能暴跌——因为Spliterator切分效率低 - 真要用,优先从
ArrayList或数组出发,并确认所有中间操作是无状态的(比如不用peek改外部计数器)
最常被忽略的一点:Stream 不能复用。调一次 collect 后再调 forEach,会直接抛 IllegalStateException。需要多次消费?要么重新生成 Stream(list.stream() 再来一遍),要么先 collect 成集合再反复用——别试图“缓存 Stream 对象”。










