解析XML列表常用DOM、SAX、XPath和JAXB方法;DOM适合小中型文件,SAX节省内存处理大文件,XPath简化节点查询,JAXB实现对象映射。

在处理XML数据时,经常会遇到包含列表结构的数据。解析XML中的列表需要正确读取重复的元素节点,并将其转换为程序可用的结构(如数组或列表)。下面介绍几种常见的解析XML列表的方法,并附上实用示例。
使用DOM解析XML列表
DOM(Document Object Model) 将整个XML文档加载到内存中,形成树结构,适合小到中等规模的XML文件。
步骤如下:
- 加载XML文档
- 通过标签名获取所有相同节点
- 遍历节点并提取内容
Java编程思想 Bruce Eckel Effective Java Joshua Bloch
Java中使用DOM解析上述列表:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse(new InputSource(new StringReader(xmlString)));
NodeList bookNodes = doc.getElementsByTagName("book");
for (int i = 0; i < bookNodes.getLength(); i++) {
Element bookElement = (Element) bookNodes.item(i);
String title = bookElement.getElementsByTagName("title").item(0).getTextContent();
String author = bookElement.getElementsByTagName("author").item(0).getTextContent();
System.out.println("书名: " + title + ", 作者: " + author);
}
使用SAX解析大型XML列表
SAX(Simple API for XML) 是事件驱动的流式解析器,适合处理大文件,节省内存。
关键点:
- 实现
DefaultHandler类 - 在
startElement和endElement中判断当前标签 - 用标志位记录是否在某个列表项中
当遇到开始时设置标志,在结束时保存数据。
功能列表:底层程序与前台页面分离的效果,对页面的修改无需改动任何程序代码。完善的标签系统,支持自定义标签,公用标签,快捷标签,动态标签,静态标签等等,支持标签内的vbs语法,原则上运用这些标签可以制作出任何想要的页面效果。兼容原来的栏目系统,可以很方便的插入一个栏目或者一个栏目组到页面的任何位置。底层模版解析程序具有非常高的效率,稳定性和容错性,即使模版中有错误的标签也不会影响页面的显示。所有的标
使用XPath定位XML列表项
XPath 可以直接定位到指定路径的节点集合,简化列表提取过程。
示例:提取所有书名
XPath xpath = XPathFactory.newInstance().newXPath();
NodeList titles = (NodeList) xpath.compile("/books/book/title/text()").evaluate(doc, XPathConstants.NODESET);
for (int i = 0; i < titles.getLength(); i++) {
System.out.println(titles.item(i).getNodeValue());
}
使用第三方库(如Jsoup或Jackson XML)
虽然Jsoup主要用于HTML,但某些场景下也可解析简单XML。更推荐使用Jackson XmlMapper或JAXB将XML映射为Java对象。
例如,定义一个Book类:
@XmlRootElement(name = "books")
@XmlAccessorType(XmlAccessType.FIELD)
public class Books {
@XmlElement(name = "book")
private List bookList;
// getter and setter
}
class Book {
public String title;
public String author;
}
然后使用JAXB解组:
JAXBContext context = JAXBContext.newInstance(Books.class); Unmarshaller unmarshaller = context.createUnmarshaller(); Books books = (Books) unmarshaller.unmarshal(new StringReader(xmlString));
基本上就这些方法。选择哪种方式取决于XML大小、性能要求和开发环境。DOM直观易用,SAX适合大文件,XPath查询灵活,而JAXB更适合对象映射场景。









