0

0

如何在 PHP 中将 HTML 字符串转换为可解析的 DOM 对象

花韻仙語

花韻仙語

发布时间:2026-01-30 19:03:01

|

923人浏览过

|

来源于php中文网

原创

如何在 PHP 中将 HTML 字符串转换为可解析的 DOM 对象

本文介绍如何将 html 字符串(如 `"

hi"`)转换为 php 中可操作的 dom 对象,替代 simple_html_dom 的 `file_get_html()`,推荐使用原生 `domdocument` + `domxpath` 实现安全、高效、无依赖的 html 解析。

在 PHP 开发中,经常需要动态解析 HTML 内容——例如从 API 响应、数据库字段或模板渲染结果中获取的 HTML 字符串。虽然第三方库如 simple_html_dom 提供了类似 file_get_html() 的便捷接口,但它已多年未维护,且存在内存泄漏与 XSS 风险隐患。PHP 原生的 DOMDocument 类是更可靠、标准且性能更优的选择。

要将 HTML 字符串转为可遍历、可查询的 DOM 对象,核心步骤如下:

  1. 实例化 DOMDocument
  2. 调用 loadHTML() 加载字符串(注意:需处理 UTF-8 编码与警告抑制)
  3. 配合 DOMXPath 执行 XPath 查询,精准定位节点

✅ 推荐实践代码(含错误处理与编码适配):

Hello

World!

"; // 创建 DOMDocument 实例 $dom = new DOMDocument(); // 【关键】禁用警告(HTML 可能不规范)、设置 UTF-8 编码兼容性 libxml_use_internal_errors(true); $dom->recover = true; // 尝试修复破损 HTML $dom->loadHTML('' . $html_string, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD); libxml_clear_errors(); // 初始化 XPath 查询器 $xpath = new DOMXPath($dom); // 示例 1:获取所有 p 标签的文本内容 $paragraphs = $xpath->query('//p'); foreach ($paragraphs as $p) { echo "Paragraph: " . trim($p->textContent) . "\n"; // 输出:Paragraph: World! } // 示例 2:按 class 属性查找特定元素 $introElements = $xpath->query('//p[@class="intro"]'); if ($introElements->length > 0) { echo "Found intro paragraph: " . $introElements->item(0)->textContent . "\n"; } // 示例 3:获取 body 内部全部 HTML(outerHTML 风格) $body = $xpath->query('//body')->item(0); if ($body) { $bodyHtml = ''; foreach ($body->childNodes as $child) { $bodyHtml .= $dom->saveHTML($child); } echo "Body inner HTML: " . trim($bodyHtml) . "\n"; }

⚠️ 注意事项:

Android数据格式解析对象JSON用法 WORD版
Android数据格式解析对象JSON用法 WORD版

本文档主要讲述的是Android数据格式解析对象JSON用法;JSON可以将Java对象转成json格式的字符串,可以将json字符串转换成Java。比XML更轻量级,Json使用起来比较轻便和简单。JSON数据格式,在Android中被广泛运用于客户端和服务器通信,在网络数据传输与解析时非常方便。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载

立即学习PHP免费学习笔记(深入)”;

  • loadHTML() 默认会自动补全 、 等缺失标签,并添加 DOCTYPE,如需避免,务必传入 LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD 标志;
  • 若 HTML 含中文或特殊字符,请确保字符串为 UTF-8 编码,并在 loadHTML() 前添加 前缀(如上例),防止乱码;
  • 不建议直接使用 simple_html_dom::str_get_html() —— 它非官方、无类型约束、不兼容 PHP 8+,且无法利用现代 DOM 标准接口;
  • 如需链式操作或 jQuery 风格语法,可考虑现代替代方案如 symfony/dom-crawler,但纯原生方案已足够应对绝大多数解析场景。

总结:用 DOMDocument::loadHTML() + DOMXPath 是将 HTML 字符串转化为强类型、可查询、可扩展 DOM 对象的标准 PHP 方式——无需外部依赖、兼容性好、安全性高,是生产环境的首选方案。

相关文章

HTML速学教程(入门课程)
HTML速学教程(入门课程)

HTML怎么学习?HTML怎么入门?HTML在哪学?HTML怎么学才快?不用担心,这里为大家提供了HTML速学教程(入门课程),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
PHP Symfony框架
PHP Symfony框架

本专题专注于PHP主流框架Symfony的学习与应用,系统讲解路由与控制器、依赖注入、ORM数据操作、模板引擎、表单与验证、安全认证及API开发等核心内容。通过企业管理系统、内容管理平台与电商后台等实战案例,帮助学员全面掌握Symfony在企业级应用开发中的实践技能。

78

2025.09.11

jquery插件有哪些
jquery插件有哪些

jquery插件有jQuery UI、jQuery Validate、jQuery DataTables、jQuery Slick、jQuery LazyLoad、jQuery Countdown、jQuery Lightbox、jQuery FullCalendar、jQuery Chosen和jQuery EasyUI等。本专题为大家提供jquery插件相关的文章、下载、课程内容,供大家免费下载体验。

151

2023.09.12

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

jquery删除元素的方法
jquery删除元素的方法

jquery可以通过.remove() 方法、 .detach() 方法、.empty() 方法、.unwrap() 方法、.replaceWith() 方法、.html('') 方法和.hide() 方法来删除元素。更多关于jquery相关的问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

396

2023.11.10

jQuery hover()方法的使用
jQuery hover()方法的使用

hover()是jQuery中一个常用的方法,它用于绑定两个事件处理函数,这两个函数将在鼠标指针进入和离开匹配的元素时执行。想了解更多hover()的相关内容,可以阅读本专题下面的文章。

504

2023.12.04

jquery实现分页方法
jquery实现分页方法

在jQuery中实现分页可以使用插件或者自定义实现。想了解更多jquery分页的相关内容,可以阅读本专题下面的文章。

187

2023.12.06

jquery中隐藏元素是什么
jquery中隐藏元素是什么

jquery中隐藏元素是非常重要的一个概念,在使用jquery隐藏元素之前,需要先了解css样式中关于元素隐藏的属性,比如display、visibility、opacity等属性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

120

2024.02.23

jquery中什么是高亮显示
jquery中什么是高亮显示

jquery中高亮显示是指对页面搜索关键词时进行高亮显示,其实现办法:1、先获取要高亮显示的行,获取搜索的内容,再遍历整行内容,最后添加高亮颜色;2、使用“jquery highlight”高亮插件。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

176

2024.02.23

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

9

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 10.3万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号