XML Schema中string、int、date是内置简单类型,须用xs:simpleType+xs:restriction约束;引用必须带xs:前缀(如xs:string),xs:date格式严格为YYYY-MM-DD,xs:int范围为−2,147,483,648至2,147,483,647,枚举需基于xs:restriction定义,正则仅支持XSD 1.0语法。

XML Schema里string、int、date不是“类型”而是“内置简单类型”
它们不能直接当“自定义类型”用,必须通过xs:simpleType + xs:restriction来约束。比如写<xs:element name="age" type="int"/>会报错——因为int是xs:int,必须带命名空间前缀,且不能裸写。
常见错误现象:Invalid simple type 'int': no such type defined 或解析器静默忽略约束。
- 所有内置类型都属于
http://www.w3.org/2001/XMLSchema命名空间,引用时必须用xs:前缀(如xs:string) -
xs:date要求格式严格为YYYY-MM-DD,不接受2024/05/20或20-05-2024 -
xs:int范围是−2,147,483,648 到 2,147,483,647,超限值会导致验证失败,不是截断或四舍五入
用xs:restriction给xs:string加长度和模式限制
直接写type="xs:string"只能校验是否为字符串,没法控长度或格式。真正做业务约束得靠xs:restriction套一层。
使用场景:用户名不能超20字符、手机号必须是11位数字、邮箱需符合基本格式。
- 长度限制用
xs:maxLength和xs:minLength,单位是Unicode码点数(不是字节数),中文英文都算1 - 正则用
xs:pattern,语法是XSD 1.0的简化版,不支持\d,得写[0-9];多个模式要拆成多个xs:pattern - 注意
xs:pattern默认是全匹配(即自动加^和$),不用自己写
<xs:simpleType name="phone">
<xs:restriction base="xs:string">
<xs:pattern value="[0-9]{11}"/>
</xs:restriction>
</xs:simpleType>
xs:date和xs:dateTime的时区处理容易被忽略
xs:date只认YYYY-MM-DD或YYYY-MM-DDZ(UTC)或YYYY-MM-DD+08:00,没时区信息的字符串(如2024-05-20)会被当作本地时间处理,不同解析器行为可能不一致。
性能影响:带时区的xs:dateTime在某些老版本Java JAXB中解析慢20%+,因为要算偏移。
- 如果业务只要日期不要时间,坚持用
xs:date,别用xs:dateTime再截掉时间部分 - 避免写
2024-05-20T00:00:00这种“伪dateTime”——它不是合法xs:dateTime(缺时区或Z) - XML文档声明里
xml:lang或xml:base对日期解析无影响,别白加
xs:int不能替代枚举,也别拿它硬凑布尔逻辑
有人用xs:int配xs:enumeration模拟布尔(0/1),这在技术上可行,但语义错乱:XSD验证器不会阻止传2进来,除非你手动列全所有非法值。
使用场景:状态码、固定选项集、开关标识。
- 真要表达布尔,用
xs:boolean(接受true/false或1/0,但后者只是兼容写法) - 枚举必须用
xs:restriction+ 多个xs:enumeration,每个value是字符串,不是数字字面量 -
xs:int本身不支持xs:enumeration直接挂载,必须先base="xs:int"再限制
<xs:simpleType name="status">
<xs:restriction base="xs:int">
<xs:enumeration value="0"/>
<xs:enumeration value="1"/>
</xs:restriction>
</xs:simpleType>
XSD类型系统是静态的,所有约束都在解析时一次性生效,运行时无法动态改。最容易被绕过的其实是xs:pattern的正则能力——它不支持前瞻、后瞻、非捕获组,写复杂校验前先查XSD 1.0规范里的RE grammar。










