StAX是Java提供的拉模式流式XML解析API,将XML视为START_ELEMENT等事件流,通过XMLStreamReader或XMLEventReader主动读取;与SAX同为内存友好型事件驱动解析器,但StAX支持中途退出、多流处理及读写一体。

StAX(Streaming API for XML)是 Java 提供的一种流式 XML 解析 API,核心特点是“拉模式”(pull parsing)——由程序主动从解析器中逐个读取事件,而不是被动等待解析器推送事件。
StAX 的本质特点
它把 XML 文档看作一个可遍历的事件流,比如 START_ELEMENT、END_ELEMENT、CHARACTERS、COMMENT 等。主要接口包括:
-
XMLStreamReader:基于光标(cursor)的读取方式,调用
next()或nextTag()主动推进 -
XMLEventReader:基于迭代器(iterator)的方式,用
hasNext()和nextEvent()控制流程 - 所有操作都位于 javax.xml.stream 包下,JDK 1.6+ 原生支持
StAX 和 SAX 的相同点
两者都是流式解析器,不将整个 XML 加载进内存,适合处理大文件;都基于事件模型,围绕元素开始、结束、文本内容等基本事件展开;都不支持随机访问或直接修改文档结构。
StAX 和 SAX 的关键区别
- SAX 是“推模式”(push):解析器控制节奏,触发回调(如
startElement()),你必须提前注册好所有处理器 - StAX 是“拉模式”(pull):你掌握控制权,想读到哪就停在哪,可以跳过无关节点、嵌套判断、中途退出
- SAX 的回调逻辑容易因状态管理复杂而出错;StAX 代码更线性、易读、易调试
- StAX 支持同时解析多个 XML 流;SAX 每次只能绑定一个 Handler 处理一个文档
- StAX 提供写入能力(XMLStreamWriter),SAX 只能读不能写
什么时候该选 StAX 而不是 SAX
- 需要在解析中途根据内容决定是否继续(比如只处理
下的数据) - 要混合处理多个 XML 源(如从不同 HTTP 响应流中交替读取)
- 希望代码结构贴近业务逻辑,避免层层嵌套的状态机
- 后续还要生成 XML(用同一套 API 写入,保持风格统一)
基本上就这些。StAX 不是取代 SAX,而是提供一种更可控、更符合现代编码习惯的流式解析选择。










