<p>XML是一种结构清晰、可读性强的标记语言,用于存储和传输数据。1. 基本结构包括XML声明、根元素和嵌套的子元素与属性,如<?xml version="1.0" encoding="UTF-8"?><bookstore><book category="fiction"><title>The Great Gatsby</title></book></bookstore>;2. 元素区分大小写,必须正确闭合和嵌套,命名不能以数字或“xml”开头,可包含字母、数字、连字符等;3. 属性提供额外信息,需用引号包围,一个元素内属性名不可重复,不支持多值;4. 特殊字符需用实体引用表示,如&代表&,也可使用CDATA区块包裹含特殊字符的内容;5. 注释格式为<!-- 注释内容 -->,空白字符会被保留,需注意格式化对可读性和文件大小的影响。掌握这些规则即可编写合法的XML文档。</p>

XML(可扩展标记语言)是一种用于存储和传输数据的标记语言,它的设计重点是简洁、可读性强,并且结构清晰。下面介绍 XML 的基本语法和规则,帮助你快速入门。
1. XML 文档的基本结构
一个标准的 XML 文档通常包含以下部分:
- XML 声明:写在文档最开头,用来声明 XML 版本和编码方式(可选但推荐)。
- 根元素:整个文档必须有且仅有一个根元素,所有其他元素都嵌套在它里面。
- 元素和属性:用于组织和描述数据。
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book category="fiction">
<title>The Great Gatsby</title>
<author>F. Scott Fitzgerald</author>
<price>12.99</price>
</book>
</bookstore>
上面的例子中,bookstore 是根元素,book 是子元素,category 是属性。
2. XML 元素语法规则
元素是 XML 的核心构建块,必须遵循以下规则:
- 元素名称区分大小写:
<Title>和<title>是不同的。 - 元素必须正确闭合:每个开始标签
<tag>必须有对应的结束标签</tag>,或使用自闭合形式<tag />。 - 元素必须正确嵌套:不能交叉嵌套,例如
<a><b></a></b>是错误的。 - 元素名不能以数字或 XML 开头,如
<123abc>或<xmlData>不合法。 - 元素名可以包含字母、数字、连字符、下划线和点,但建议使用有意义的名称。
3. XML 属性规则
属性提供有关元素的额外信息,写在开始标签内:
- 属性值必须用引号包围,可以是双引号或单引号,推荐使用双引号。
- 一个元素可以有多个属性,但属性名不能重复。
- 属性不能包含多个值(不像 HTML 的 class),如需多个值应使用子元素。
示例:
<person id="001" gender="male" status="active"><name>John Doe</name>
<age>30</age>
</person>
4. 特殊字符与实体引用
某些字符在 XML 中有特殊含义,不能直接使用,需用实体引用代替:
-
&写成& -
<写成 -
>写成> -
"写成" -
'写成'
也可以使用 CDATA 区块包裹大段含特殊字符的内容:
<description><![CDATA[This book costs <$10 and is >500 pages long.]]>
</description>
5. 注释和空白处理
注释用于说明内容,不会被解析器处理:
<!-- 这是一个注释 -->XML 会保留换行、空格等空白字符,所以格式化时要注意可读性与文件大小的平衡。
基本上就这些。掌握这些基础语法规则后,你就能写出结构正确、易于解析的 XML 文件了。不复杂但容易忽略细节,多练习几次就能熟练。










