0

0

PHP怎么接收XML带BOM数据_PHP接收XML带BOM数据的实现【技巧】

看不見的法師

看不見的法師

发布时间:2025-12-25 20:20:55

|

696人浏览过

|

来源于php中文网

原创

PHP解析带UTF-8 BOM的XML报错时,需先清除BOM再解析:一、file_get_contents读取后用正则或ltrim去除EF BB BF;二、自定义stream_filter在流层过滤;三、DOMDocument设recover=true并预处理;四、mb_convert_encoding转码后截断BOM;五、cURL客户端层响应后清理。

php怎么接收xml带bom数据_php接收xml带bom数据的实现【技巧】

如果PHP脚本接收到带有UTF-8 BOM头的XML数据,解析时可能因BOM字符(EF BB BF)导致SimpleXML或DOMDocument报错“invalid character”或“not well-formed”。以下是处理该问题的具体操作步骤:

一、使用file_get_contents读取后手动去除BOM

此方法适用于通过HTTP POST接收原始XML体或从文件读取XML内容的场景。先读取原始字节流,再检测并剥离开头的BOM序列,确保后续XML解析器获得纯净内容。

1、使用file_get_contents获取原始XML字符串,例如:$raw_xml = file_get_contents('php://input');。

2、定义BOM检测函数,判断字符串开头是否为UTF-8 BOM:
function removeBom($str) { return preg_replace('/^\xEF\xBB\xBF/', '', $str); }。

立即学习PHP免费学习笔记(深入)”;

3、调用该函数处理原始XML:
$clean_xml = removeBom($raw_xml);。

4、将清理后的字符串传入simplexml_load_string()或DOMDocument::loadXML()进行解析。

二、使用stream_wrapper_register自定义输入流过滤

该方法在数据流入PHP解析器前即完成BOM剥离,适用于需统一处理多处XML输入的项目结构,避免重复编码逻辑。

1、定义一个过滤类,继承php_user_filter,重写filter方法,在其中移除BOM头。

2、注册该过滤器:
stream_filter_register('bom_strip', 'BomStripFilter');。

3、打开php://input流并附加过滤器:
$fp = fopen('php://input', 'rb');
fopen('php://filter/read=bom_strip/resource=php://input', 'r');。

4、使用fread或stream_get_contents读取已过滤的XML内容。

三、通过DOMDocument设置recover选项并预处理

当无法控制输入源且必须兼容带BOM的XML时,可结合DOMDocument的错误恢复机制与字符串预处理,提高容错性。

1、读取原始XML数据到变量中,如$raw = file_get_contents('php://input');。

Programming Helper
Programming Helper

AI代码自动生成器,在AI的帮助下更快地编程

下载

2、执行$raw = ltrim($raw, "\xEF\xBB\xBF");,仅清除开头BOM,不依赖正则。

3、初始化DOMDocument对象:
$dom = new DOMDocument();
$dom->recover = true;
$dom->strict = false;。

4、调用$dom->loadXML($raw)加载清洗后的XML内容。

四、使用mb_convert_encoding强制转码并截断BOM

利用多字节字符串处理函数识别并消除BOM,特别适用于存在编码混淆风险(如误标为ISO-8859-1但实际含UTF-8 BOM)的混合环境。

1、读取原始XML内容,保存为$source_xml。

2、执行转换并归一化编码:
$converted = mb_convert_encoding($source_xml, 'UTF-8', 'UTF-8');。

3、再次执行ltrim($converted, "\xEF\xBB\xBF")确保BOM被清除。

4、将结果传递给simplexml_load_string($converted)进行解析。

五、在cURL或客户端层提前剥离BOM

若XML由PHP自身作为客户端发起请求获取(如调用第三方API),可在接收响应后立即处理BOM,避免污染下游解析逻辑。

1、使用curl_exec获取响应体,赋值给$response_body。

2、检查响应头Content-Type是否包含charset=utf-8,确认可能存在BOM。

3、执行$response_body = preg_replace('/^[\x00-\x08\x0B\x0C\x0E-\x1F\x7F]*/', '', $response_body); 清除控制字符前缀。

4、再单独匹配并移除UTF-8 BOM:
$response_body = preg_replace('/^\xEF\xBB\xBF/', '', $response_body);。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
resource是什么文件
resource是什么文件

Resource文件是一种特殊类型的文件,它通常用于存储应用程序或操作系统中的各种资源信息。它们在应用程序开发中起着关键作用,并在跨平台开发和国际化方面提供支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

181

2023.12.20

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1948

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1168

2024.11.28

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

454

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.4万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号