0

0

PostgreSQL的xml_is_well_formed函数怎么用

月夜之吻

月夜之吻

发布时间:2025-12-27 12:47:04

|

511人浏览过

|

来源于php中文网

原创

xml_is_well_formed只接受text类型输入,用于快速校验XML字符串是否符合基础Well-Formed规则,不解析结构、不支持xml类型参数,也不做DTD/XSD验证。

postgresql的xml_is_well_formed函数怎么用

xml_is_well_formed 只接受 text 类型输入,不能直接传 XML 值

xml_is_well_formed 是 PostgreSQL 提供的纯文本校验函数,它不解析 XML 结构,也不做 DTD 或 Schema 验证,只检查字符串是否符合基础的 Well-Formed 规则(比如标签闭合、嵌套合法、字符转义正确等)。关键点是:它**只接受 text 参数,不接受 xml 类型值**。如果你传入一个已成功转换为 xml 类型的值(比如用 XMLPARSE 构造的),会报错:function xml_is_well_formed(xml) does not exist

  • ✅ 正确用法:xml_is_well_formed('<root><child>ok</child></root>')
  • ❌ 错误用法:xml_is_well_formed(XMLPARSE(CONTENT '<root>...</root>'))
  • ⚠️ 注意:即使字符串里有 BOM(如 UTF-8 BOM \xEF\xBB\xBF),也会导致返回 false

常见校验失败原因:空字符串、null、编码问题、非法字符

该函数对输入非常敏感,以下情况都会返回 false

  • 输入为 NULL → 返回 NULL(不是 false,注意三值逻辑)
  • 空字符串 '' → 返回 false
  • 含不可见控制字符(如 \x00\x01\x08\x0B\x0C\x0E\x1F)→ 返回 false
  • UTF-8 编码错误(如截断的多字节序列)→ 返回 false
  • XML 声明中指定了不支持的编码(如 encoding="ISO-8859-1" 但内容实际是 UTF-8)→ 返回 false

所以实际使用时建议先用 length()convert_from() 粗筛,再调用 xml_is_well_formed

和 XMLPARSE 的关系:校验 ≠ 解析,两者要配合用

xml_is_well_formed 快但浅,XMLPARSE 慢但深。前者适合在 INSERT/UPDATE 前快速过滤明显坏数据;后者才真正构建 XML 树并报详细错误(比如“mismatched tag”)。典型组合用法:

Cursor
Cursor

一个新的IDE,使用AI来帮助您重构、理解、调试和编写代码。

下载
SELECT 
  data,
  xml_is_well_formed(data) AS is_wf,
  CASE 
    WHEN xml_is_well_formed(data) THEN XMLPARSE(CONTENT data)
    ELSE NULL 
  END AS parsed_xml
FROM (VALUES 
  ('<root><item>test</item></root>'),
  ('<root><item>unclosed'),
  ('')
) AS t(data);
  • xml_is_well_formed 能避免 XMLPARSE 因语法错误而中断整个查询
  • 但它无法发现语义错误(如重复 ID、非法命名空间前缀),这些仍需后续用 XPath 或 XSLT 处理
  • 性能上,xml_is_well_formedXMLPARSE 快 3–5 倍(实测千行随机 XML 字符串)

替代方案:需要 Schema 验证就得用外部工具或 plpythonu

PostgreSQL 内置不支持 DTD/XSD 验证。xml_is_well_formed 只管“形”,不管“义”。如果业务要求必须符合某 XSD:

  • plpythonu + lxml(需启用扩展并安装 Python 包)
  • 在应用层解析(推荐:更可控、易调试、可复用验证逻辑)
  • 导入前用 xmllint --schema schema.xsd --noout file.xml 预检(Shell 批处理场景)

别指望靠 xml_is_well_formed 拦住所有非法 XML —— 它连注释里的 <![CDATA[ 嵌套错误都可能放过。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1949

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1171

2024.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1569

2023.10.24

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号