0

0

疯狂XML学习笔记(2)-------------格式要求

黄舟

黄舟

发布时间:2017-02-21 14:04:18

|

1733人浏览过

|

来源于php中文网

原创

Xml的语法

         一个XML文件分为如下几部分内容:

     文档声明

     元素

     属性

     注释 

     CDATA区、特殊字符

     处理指令(processing instruction

Xml的声明

最简单声明

 

Encoding属性:字符编码如果没有指定默认的是UTF-8编码

常见的字符集

简体中文:GBK GB2312

繁体中文: BIG5

西欧字符:ISO8859-1

通用的国际编码:Unicode  UTF-8

演示案例:

 

中国>中国>

引起错误的原因是:编码的错误

解码成字符

 字符集错误时的xml文档

新建是一个.txt文档

保存的是.xml UTF-8

默认的编码ANSI

中国

写入到硬盘

编码成二进制码

00 11

磁盘文件

 

Standalone:指定该文档是否需要引用其它资源,属性值只有:yesno

Yes:独立      No:不独立

 

XML文件和HTML文件一样,实际上是一个文本文件。

显然大家立刻就会明白,创建XML文件最普通的工具和HTML一样,就是"记事本"了。

除了"记事本"之外,当然还有一些更加方便的工具,如XML Notepad、XML Pro、CLIP!XML Editor等,

这些工具的一大特点是:能够检查你所建立的XML文件是否符合XML规范。不过,现在这些工具都只有英文版的,并且需要付费使用。

当然,你仍然能够使用FrontPage、DreamWeaver等工具,不过使用起来不是很方便。

随着XML的逐渐普及,相信在不久后,也会出现非常好用的创建XML文件的工具。
现在我们暂且使用"记事本"来创建我们的XML文件吧。先看一个XML文件:

 
例1


〈?xml version="1.0" encoding="gb2312" ?〉
〈参考资料〉
〈书籍〉
〈名称〉XML入门精解〈/名称〉
〈作者〉张三〈/作者〉
〈价格 货币单位="人民币"〉20.00〈/价格〉
〈/书籍〉
〈书籍〉
〈名称〉XML语法〈/名称〉
〈!--此书即将出版--〉
〈作者〉李四〈/作者〉
〈价格 货币单位="人民币"〉18.00〈/价格〉
〈/书籍〉
〈/参考资料〉

 


这是一个典型的XML文件,编辑好后保存为一个以.xml为后缀的文件。我们可以将此文件分为文件序言(Prolog)和文件主体两个大的部分。

在此文件中的第一行即是文件序言。该行是一个XML文件必须要声明的东西,而且也必须位于XML文件的第一行,它主要是告诉XML解析器如何工作。

其中,version是标明此XML文件所用的标准的版本号,必须要有;encoding指明了此XML文件中所使用的字符类型,可以省略,在你省略此声明的时候,后面的字符码必须是Unicode字符码(建议不要省略)

。因为我们在这个例子中使用的是GB2312字符码,所以encoding这个声明也不能省略。在文件序言部分还有一些声明语句,我们在后面给予介绍。

 


文件的其余部分都是属于文件主体,XML文件的内容信息存放在此。

我们可以看到,文件主体是由开始的〈参考资料〉和结束的〈/参考资料〉控制标记组成,这个称为XML文件的"根元素";〈书籍〉是作为直属于根元素下的"子元素";在〈书籍〉下又有〈名称〉、〈作者〉、〈价格〉这些子元素。货币单位是〈价格〉元素中的一个"属性","人民币"则是"属性值"。


首先,XML文件的第一行必须是声明该文件是XML文件以及它所使用的XML规范版本。在文件的前面不能够有其它元素或者注释。


第二,在XML文件中有且只能够有一个根元素。我们的第一个例子中,〈参考资料〉... 〈/参考资料〉就是此XML文件的根元素。


第三,在XML文件中的标记必须正确地关闭,也就是说,在XML文件中,控制标记必 须有与之对应的结束标记。如:〈名称〉标记必须有对应的〈/名称〉结束标记,不像HTML,某些标记的结束标记可有可无。如果在XML文件中遇到自成一个单元的标记,就是类似于HTML 中的〈img src=http://www.php.cn/〉的这些没有结束标记的时候,XML把它称为"空元素",必须用这样的写法:〈空元素名/〉,如果元素中含有属性时写法则为:〈空元素名 属性名="属性值"/〉。


第四,标记之间不得交叉。在以前的HTML文件中,可以这样写:
〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉和〈H〉
标记之间有相互重叠的区域,而在XML中,是严格禁止这样标记交错的写法,标记必须以规则性的次序来出现。


第五,属性值必须要用" "号括起来。如第一个例子中的"1.0"、"gb2312"、"人民币"。都是用" "号括起来了的,不能漏掉。


第六,控制标记、指令和属性名称等英文要区分大小写。与HTML不同的是,在HTML中, 类似〈B〉和〈b〉的标记含义是一样的,而在XML中,类似〈name〉、〈NAME〉或〈Name〉这样的标记是不同的


第七,我们知道,在HTML文件中,如果我们要浏览器原封不动地将我们所输入的东西显示出来,可以将这些东西放到〈pre〉〈/pre〉或者〈xmp〉〈/xmp〉标记中间。这对于我们创建HTML教学的网页是必不可少的,因为网页中要显示HTML的源代码。而在XML中,要实现这样的功能,就必须使用CDATA标记。在CDATA标记中的信息被解析器原封不动地传给应用程序,并且不解析该段信息中的任何控制标记。CDATA区域是由:"〈![CDATA["为开始标记,以">〉"为结束标记。例如:例2中的源码,除了"〈![CDATA["和">〉"符号,其余的内容解析器将原封不动地交给下游的应用程序,即使CDATA区域中的开始和结尾的空白以及换行字符等,都同样会被转交(注意CDATA是大写的字符)。

 

 

 

Xml元素的基本规则

   元素是xml文档的基本单元,xml文档就是一个一个层层嵌套的元素组成的。整个的xml文档从根元素开始,根元素包含若干个子元素,而每个子元素又可以包含若干个子元素,从而可以组成一个xml文档。

Xml标签语法:

  1Xml的标签分为两类:

     单标记:中国/>

     双标记:中国>中国>

  2xml标签的要求:

      1、标签名可以有字母(包括非西欧字符)、数字、下划线(_)、中划线(-)、冒号(:)和点号(.)组成,但不能以数字、中划线和点号开头。

2、标签名不能包含>、,、$等符号

3、标签名种尽量不要出现英文的冒号(:),除非在使用命名空间。

4、标签名不能以字符xmlXML等任意大小写组合开始。

5、标签名不能包含空格。

6、标签名区分大小写

3xml标签嵌套子元素:xml允许深度嵌套子元素,只要保证元素之间合理的嵌套即可.而且xml元素可以嵌套多个重名的子元素,这多个子元素之间是有序的。

    第一个:xml

中国>

 北京>

     海淀/>

     朝阳>朝阳>

     朝阳>朝阳>

 北京>

中国>

  第二个xml

中国>

 北京>

     朝阳>朝阳>

     朝阳>朝阳>

    海淀/>

 北京>

中国>

4、空元素:空元素不可以接受子元素,也不可以接受字符串内容。

     第三个xml

     

         redarmy

          :备注:空元素但可以接受属性,而且可以接受多个属性

     

   

         redarmy

         :备注它包好的是一个空格空格也是字符

     

例如空元素接受属性:

  建议” price=”30”/>

5、字符数据

Draft&Goal-Detector
Draft&Goal-Detector

检测文本是由 AI 还是人类编写的

下载

  

      Struts2开发详解

     

         Struts2开发详解

     

  

  对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理

 如果文本字符中包含了一些特殊的字符,例如&由于这些字符都有特殊的含义,因此直接在xml文档中使用该字符串将引起文档的混乱。

   表达式>

 

        比较符>1+3比较符>

   表达式>

代表的是文本字符串中包含了特殊的字符

 

有以下两种方法解决:

1、 使用实体引用:用另一个特殊符号代替这些特殊符号

2、使用CDATA标记:将整个文档定义成字符串。

1、  使用实体引用

       

  表达式>

        比较符>1+3&6比较符>

  表达式>

上面的红色的

解决如下:

 

  表达式>

        比较符>1+3zuojiankuohaophpcn6比较符>

      表达式>

2、  使用CDATA标记

在特殊标记CDATA,所有的特殊字符,甚至是有效的元素都将被当成简单的字符串处理。实体引用也会失去作用,变成直接的文本。

CDATA的语法格式如下:

 文本内容]]>

  表达式>

        比较符>

            

               1+3

              ]]>

           比较符>

  表达式>

    备注:由于xml文档根本不会对CDATA标记内容进行任何解析,因此在CDATA内可以放置任何内容,其中的内容永远不会出错。

1、  注释

Xml文档还可以加入解释用的字符数据,这些解释用的字符串不会被xml解析器处理。这些解释用的文本称为注释。Xml的文档注释与html完全一致。

Xml注释的语法格式如下:

Xml的注释允许包含元素和标签。

注意:

1、  Xml的注释不能够放在标签体内。

2、  不要把xml文档放在xml文档声明之前  xml文档的声明永远在第一行

3、  不在注释中使用双中划线(--)

…..

2、  处理指令

处理指令,简称PI processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。

处理指令用于给处理xml文档的应用程序提供信息,告诉处理程序应该如何处理该文档。一个完备的xml文档的处理程序,可以读取xml文档的处理指令,并根据处理指令进行相应处理,或将它传给下一个程序。

Xml处理指令的格式如下:

处理指令名处理指令信息?>

3、  属性

xml属性的特征:

1、  xml元素的属性必须有属性值,属性值必须用引号引起来。

2、  同一个xml元素里不能有多个同名的属性

3、  Xml元素里的多个属性之间没有先后顺序。


     123456780
     Java讲义
      99


比如说这个book本身就有 isbn  book_name price的属性

那么


Xml必须有一个根元素。

Xml文档的整体结构

1、  必须有一个根元素(有且只有一个)

2、  元素必须合理结束

3、  元素之间必须合理嵌套

4、  元素的属性必须有属性值

只要不满足上面的条件就是一个格式不良好的xml文档

只要满足上面的条件就是一个格式良好的xml文档

并且遵守了dtd或者schema就是一个有效的xml文档。

Xml文档是一种标准的结构化文档,可以转换成DOM(Document Object Model),其根节点对应DOM树的根节点。


    
       网上介绍
       redarmy
    
    
        网上介绍
       redarmy
    


 

book

computer

computer

………

computer

name

author

 

注意:

必须具有根标记且根标记必须唯一

开始标记和结束标记需配对使用

标记不能交错使用

空标记可写成“标记名/>”的形式

标记对大小写敏感

以上就是疯狂XML学习笔记(2)-------------格式要求的内容,更多相关内容请关注PHP中文网(www.php.cn)!


热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

2

2026.01.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

446

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

145

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

258

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

9

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

13

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

10

2026.01.28

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

25

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

124

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
XML教程
XML教程

共142课时 | 6万人学习

XQuery 教程
XQuery 教程

共12课时 | 3.8万人学习

XLink  教程
XLink 教程

共7课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号