arraylist和hashmap默认构造时数组为null或共享空数组,首次add/put才初始化,以节省内存;vector/stack则构造即分配数组,无延迟。

ArrayList 的数组初始化为什么是 null?
因为 ArrayList 默认构造函数不分配数组,而是把 elementData 设为 DEFAULTCAPACITY_EMPTY_ELEMENTDATA(一个共享的空数组),直到第一次 add() 才触发扩容并真正创建指定大小的数组。
这样做能省下无用对象的内存开销——如果你新建一个 ArrayList 但始终没加元素,JVM 就不会为它分配哪怕一个 Object[]。不过这也带来一个常见误解:有人以为 new ArrayList() 会立刻持有长度为 10 的数组,结果在调试时发现 elementData 是 null 或共享空数组,误判为 bug。
- 调用
add()时才会检查是否为共享空数组,然后首次扩容到默认容量 10 - 如果用带初始容量的构造函数(如
new ArrayList(5)),则直接分配对应长度的数组,跳过延迟逻辑 - 注意:
size()返回 0 不代表底层数组不存在,只是还没被初始化;反之,elementData.length == 0也不代表集合为空(可能刚初始化、尚未 add)
HashMap 的 table 字段为何延迟初始化?
HashMap 的核心哈希桶数组 table 同样延迟到首次 put() 才创建,初始值为 null。这不只是为了省内存,更关键的是避免在未使用时提前触发树化阈值、负载因子计算等内部逻辑。
你可能会在反射查看字段时发现 table == null,但 size() == 0 —— 这完全正常。一旦调用 put(),putVal() 内部会先调用 resize(),此时才真正分配 Node[] 并设置初始容量(通常是 16)。
立即学习“Java免费学习笔记(深入)”;
- 即使设置了
initialCapacity=1,实际分配的数组长度仍是 16(向上取最近的 2 的幂) - 如果在多线程环境下反复判断
table == null并手动触发put()来“预热”,反而可能引发竞态——resize()不是线程安全的 - 使用
HashMap(int initialCapacity, float loadFactor)构造函数仍不立即建表,只记录参数,真正建表仍在首次写入
Vector 和 Stack 为什么没有这种延迟?
因为 Vector(以及继承它的 Stack)在构造时就直接 new 出数组,默认长度 10,且所有修改操作都加了 synchronized。它的设计目标是“开箱即用+线程安全”,而非内存敏感。
这意味着:如果你只是需要一个线程不安全、轻量级的列表,用 Vector 反而浪费了初始数组空间和同步开销;反过来,如果你误以为 ArrayList 和 Vector 在初始化行为上一致,就容易对内存占用或首次 add 性能产生错误预期。
-
Vector的elementData永远不是null,构造后即存在 -
Stack是Vector子类,自然也继承该行为,没有延迟加载 - Java 9+ 中
List.of()、Map.of()等不可变集合更是完全不维护可变数组,谈不上延迟——它们压根没有“首次添加”这个动作
如何验证某个集合是否用了延迟加载?
最直接的办法是用反射读取其核心数组字段(如 elementData、table),观察是否为 null 或共享空对象,再对比 size() 是否为 0。
注意别依赖 IDE 的变量视图自动调用 toString() 或展开结构——某些调试器会偷偷触发 toArray() 或迭代器,间接导致数组被初始化,造成误判。
- 正确姿势:
Field f = ArrayList.class.getDeclaredField("elementData"); f.setAccessible(true); System.out.println(f.get(list)); // 输出 null 或 [] - 对
HashMap,查table字段;对LinkedHashMap,还要注意header节点在构造时就已创建,但table仍是延迟的 - 单元测试中若需稳定复现“未初始化”状态,请避免调用任何可能触发内部初始化的方法(包括
isEmpty()在某些旧版 JDK 中曾有副作用)








