详解XML- JAXP技术-DOM解析

黄舟

发布时间：2017-03-31 14:12:29

1847人浏览过

来源于php中文网

原创

　　dom解析的基本思路：

　　　　1、将整个XML文件一次性读入内存

　　　　2、将整个XML看做一棵树

　　　　3、XML中的每一个标签，属性，文本都看做是树上的一个结点

　　　　4、然后可以对结点进行增删改查的操作

　　话不多说，上代码。

　　1、首先我在D:\ABC中新建了一个文本文件，重命名为stus.xml，以下是文件中的内容

　在第一行是XML声明，version表示版本号，encoding表示编码方式，微软的记事本用的是国标的编码方式，如果要用UTF-8，则要在另存为窗口中修改编码方式为UTF-8。

　必须且只能有一对根标签，我写的根标签是。其他的就不多说了。

2、这是一个学生类，定义了一些属性和get、set方法

public class Student {
	public static String Class;
	private String name;
	private int num;
	private int age;
	private char sex;

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getNum() {
		return num;
	}

	public void setNum(int num) {
		this.num = num;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	public char getSex() {
		return sex;
	}

	public void setSex(char sex) {
		this.sex = sex;
	}

}

　　3、这是用DOM解析的类，看这个类之前还要了解一下。

　　　　DocumentBuilderFactory　DOM解析器工厂

　　　　DocumentBuilder　DOM解析器

　　　　Document　文档对象

　　　　Node　结点【接口】

PHP5学习对象教程

PHP5学习对象教程由美国人古曼兹、贝肯、瑞桑斯编著，简张桂翻译，电子工业出版社于2007年12月1日出版的关于PHP5应用程序的技术类图书。该书全面介绍了PHP 5中的新功能、编程方法及设计模式，还分析阐述了PHP 5中新的数据库连接处理、错误处理和XML处理等机制，帮助读者系统了解、熟练掌握和高效应用PHP。

下载

　　　　Element　元素结点【标签结点】

　　　　Attr　属性结点

　　　　Text　文本结点

　　　　Node 是Document，Element,Attr,Text的父接口

　　　　NodeList 结点列表

　　　　NamedNodeMap 一个结点的所有属性

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Attr;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import bean.Student;

public class DOMParser {

	public static void main(String[] args) throws Exception {

		// 得到解析器工厂对象
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

		// 生产一个解析器对象
		DocumentBuilder builder = factory.newDocumentBuilder();

		// 开始解析XML文件,得到解析的结果，是一个Document对象
		// Document对象叫做文档树对象
		Document dom = builder.parse("D:\\ABC\\stus.xml");

		// 通过Document对象提取数据
		// Document对象的第一个子节点是根节点[根标签]
		Node root = dom.getFirstChild();
		// 获得标签的名字
		String str = root.getNodeName();
		// 获得根节点的属性
		NamedNodeMap attrs = root.getAttributes();
		// 强转成Attr类型 属性类
		Attr attr = (Attr) attrs.getNamedItem("class");
		// 获得属性里的值
		String v = attr.getValue();
		System.out.println(v);

		// 获得所有的学生-------------------------------------
		NodeList list = root.getChildNodes();
		for (int i = 0; i < list.getLength(); i++) {
			Node node = list.item(i);
			// 判断是否是标签结点
			if (node instanceof Element) {
				Element e = (Element) node;
				// 获得标签结点里属性的值
				String num = e.getAttribute("num");
				System.out.println(num);

				// 输出标签中的文本
				// System.out.println(e.getTextContent());

				// 继续获得stu的子节点
				NodeList nodeList = e.getChildNodes();
				for (int j = 0; j < nodeList.getLength(); j++) {
					Node n = nodeList.item(j);
					if (n instanceof Element) {
						Element ele = (Element) n;
						// 获得元素结点的标签名字
						String nodeName = ele.getNodeName();
						// 获得元素结点标签中的文本
						String value = ele.getTextContent();
						if (nodeName.equals("name")) {
							System.out.println("姓名:" + value);
						} else if (nodeName.equals("age")) {
							System.out.println("年龄：" + value);
						} else if (nodeName.equals("sex")) {
							System.out.println("性别：" + value);
						}
					}
				}
			}
		}
	}
}

　　自己在其中总结了一些方法：

　　DocumentBuilderFactory类：

　public static DocumentBuilderFactory newInstance();　//得到解析器工厂对象
　　　　public abstract DocumentBuilder newDocumentBuilder();　//生产一个解析器对象

　　DocumentBuilder类：

　　　　public Document parse(String uri);　//解析路径为uri的XML文件,得到解析的结果是一个Document对象

　　Node类：

　public Node getFirstChild();　//得到Document对象的第一个子结点，也就是根结点、或者叫根标签，在上面的代码中得到的是stus，看上面的第1点中的XML文件的内容。
　　　　public NamedNodeMap getAttributes();//获得结点的属性
　　　　public NodeList getChildNodes();//获得所有子结点
　　　　public String getNodeName();//获得标签的名字 
　　　　public String getTextContent() throws DOMException;//获得标签结点中的文本

　　NamedNodeMap类：　　　　

　　　　public Node getNamedItem(String name);//返回所有名字为name的结点

　　Attr类：

　　　　public String getValue();//获得属性里的值

　　NodeList类：

　　　　public Node item(int index);//返回第index个结点

　　Element类：

　　　　public String getAttribute(String name);//获得标签结点里属性name的值

Final Cut Pro的XML文件怎么用 FCPXML详解

Python lxml库的etree和objectify有什么区别

Watchdog库是什么如何用Python监控文件夹变化并上传XML

如何用AI或机器学习自动推荐XML映射规则

Qt C++如何实现XML文件上传 QNetworkAccessManager

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：xml解析-增删改查操作后将其修改结果保存的代码实例下一篇：详细介绍XML原理代码实例

作者最新文章

HTML5 Placeholder属性的详情介绍

2018-05-30 09:51

html中关于标签的全部属性的使用总结

2018-05-30 14:32

php如何快速实现数组去重的实例

2018-05-30 15:03

php中关于IMAP如何收取邮件的方法介绍

2018-05-31 09:38

PHPMailer如何利用QQ邮箱完成邮件发送功能的实例分析

2018-05-31 10:28

从零开始打造自己的PHP框架的视频资料

2018-05-31 10:45

php基础知识总结（新手入门必备）

2018-05-30 14:26

ReactJS中表单的单选多选与反选的实现方法

2018-05-30 09:45

JavaScript中typeof的使用方法介绍

2018-05-30 11:42

JavaScript中confirm()方法的使用介绍

2018-05-30 10:29

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体