在进行xml文法分析之前,首先有必要了解xml语法的基本规则:
词法特征:1)XML区分大小写,如元素名在打开和关闭标记中应保持大小写一致
2)XML保留标记字符为: &,保留字符不允许出现在元素名、元素文本、属性名、属性值中,用于关闭标记,&用于转意,常见的转意为 <生成,&生成&,&apos生成’,"生成”
3)元素名以下划线或字母开始,可包含字母、数字、句点、连字符、下划线、冒号和用于其他语言的扩展字符,元素名中不能有空格符(分格符、跳格符、换行符、回车符),元素名可以由名域前缀。如:
4)属性名的规则同元素名,属性值由单引号或双引号括约其中,可由除XML保留字符以外的字符串组成,如:
句法特征:1)XML文档由一个XML说明、多个可选的文档说明、多个可选的XML指令、多个可选的XML注释和一个根元素的数据体组成,此外还可以有嵌入语句中的CDATA段,如:
/*XML说明*/ /*XML文档说明*/ /*XML注释*/ /*XML指令*//*根数据元素*/ …
2)XML说明由标关闭,其中包含版本、编码等可选说明,如:
3)XML文档说明由关闭,如:mydoc.dtd”>
4)XML指令由关闭,如:
5)XML注释由关闭,如:
6)XML元素由打开,由/>,或元素名>关闭,元素的打开和关闭标记相互匹配,如
7)CDTATA段由打开,由]]>关闭,用于使居于其中的语句规避XML解析规则。如:
根据以上的XML文法特征,可以构造出用于词法分析的正则式和用于句法分析的下推自动机结构。
XML词法正则式:
#define digit [1,2,…,9] /*数字字符*/
#define letter [a,b,…,z,A,B,…,Z] /*字母字符*/
#define signs [~, ! , @, #, %, ^, &,*,(, ), ?, :, ;, “, ‘, ,, ., /,-, _, +, =, |, /] /*符号字符*/
#define ascii2 [0x80,…,0xFF] /*ASCII chart2 扩展字符*/
#define space [0x20, /t, /r, /n] /*空格符,跳格符,回车符,换行符*/
#define reserve [, &] /*XML保留字符*/
1) 元素名的正则式:
element_name -> (_ | letter | ascii2) (ε| _ | - | : | . | digit | letter | signs | ascii2)*
2) 元素文本的正则式:
element_text -> (ε| not reserve)*
3) 属性名的正则式:
酷纬企业网站管理系统Kuwebs是酷纬信息开发的为企业网站提供解决方案而开发的营销型网站系统。在线留言模块、常见问题模块、友情链接模块。前台采用DIV+CSS,遵循SEO标准。 1.支持中文、英文两种版本,后台可以在不同的环境下编辑中英文。 3.程序和界面分离,提供通用的PHP标准语法字段供前台调用,可以为不同的页面设置不同的风格。 5.支持google地图生成、自定义标题、自定义关键词、自定义描
proper_name -> (_ | letter | ascii2) (ε| _ | - | : | . | digit | letter | signs | ascii2)*
4) 属性文本的正则式:
proper_value -> (ε| not reserve)*
XML句法结构:
xml_document -> xml_header (ε| xml_declare | xml_instruct | xml_comments)* xml_element xml_header -> [] xml_declare -> [] xml_instruct -> []reserve_word(space)* (proper_token)* (space)*[?>] xml_comments -> [Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
