
我首先尝试了PHP内置的字符串比较函数,但结果惨不忍睹。HTML代码被当作纯文本进行逐行或逐字符比较,导致输出的差异信息支离破碎,不仅无法阅读,还可能破坏原有的HTML结构。比如,仅仅是修改了一个标签的属性,整个标签甚至它所在的行都会被标记为“删除”然后“新增”,这根本不是我想要的用户体验。
我需要一个能够“理解”HTML结构,智能地识别出哪些是新增的、哪些是删除的、哪些是修改的,并且能以一种用户友好的方式(比如高亮显示)呈现这些差异的工具。在一番搜索和尝试后,我终于找到了 ssddanbrown/htmldiff 这个Composer库,它完美地解决了我的困境。
Composer在线学习地址:学习地址
ssddanbrown/htmldiff 是一个专门用于比较两个HTML字符串并输出带差异标记的HTML的PHP库。它并不是简单地进行文本比较,而是通过一套智能算法来识别HTML结构中的实际变化。它的核心思想是将差异标记(如 <ins></ins> 用于新增,<del></del> 用于删除)直接嵌入到新的HTML输出中,这样就能在保持原有HTML结构和样式的前提下,清晰地展示修改。
立即学习“前端免费学习笔记(深入)”;
安装和使用它非常简单:
首先,通过Composer安装该库:
composer require ssddanbrown/htmldiff
然后,你就可以直接使用它的静态方法来生成HTML差异:
<?php
require 'vendor/autoload.php';
use Ssddanbrown\HtmlDiff\Diff;
$oldHtml = '<p>你好,这是一个<b>旧</b>版本的文章。</p><p>这里是第二段。</p>';
$newHtml = '<p>你好,这是一个<b>新</b>版本的文章。</p><div class="aritcle_card flexRow">
<div class="artcardd flexRow">
<a class="aritcle_card_img" href="/ai/1955" title="Giiso写作机器人"><img
src="https://img.php.cn/upload/ai_manual/001/246/273/68b6d1b886fb3506.png" alt="Giiso写作机器人" onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
<div class="aritcle_card_info flexColumn">
<a href="/ai/1955" title="Giiso写作机器人">Giiso写作机器人</a>
<p>Giiso写作机器人,让写作更简单</p>
</div>
<a href="/ai/1955" title="Giiso写作机器人" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
</div>
</div><p>这是新增的第三段。</p>';
$diffOutput = Diff::excecute($oldHtml, $newHtml);
echo $diffOutput;
/*
输出示例(为清晰起见,已简化):
<p>你好,这是一个<del class="diffmod">旧</del><ins class="diffmod">新</ins>版本的文章。</p>
<p>这里是第二段。</p>
<ins class="diffins"><p>这是新增的第三段。</p></ins>
*/从上面的输出可以看出,ssddanbrown/htmldiff 智能地识别了“旧”变成了“新”,并用 <del></del> 和 <ins></ins> 标签进行了标记。同时,新增的整个段落也被 <ins></ins> 包裹起来,使得差异一目了然。
如果你需要更精细的控制,也可以创建 Diff 类的实例,并配置一些选项:
<?php use Ssddanbrown\HtmlDiff\Diff; $oldHtml = '<p>Hello there!</p>'; $newHtml = '<p>Hi there!</p>'; $diff = new Diff($oldHtml, $newHtml); $diff->ignoreWhitespaceDifferences = true; // 忽略空白字符的差异,这在HTML中非常实用 $diff->repeatingWordsAccuracy = 0.8; // 调整重复词的比较精度 $output = $diff->build(); echo $output;
ssddanbrown/htmldiff 的优势和实际应用效果:
- 直观的用户体验: 告别了难以理解的纯文本差异,用户可以直接在浏览器中看到带有高亮标记的HTML内容,清晰地了解哪些部分被添加、删除或修改。
- 保持HTML结构完整性: 它不会破坏原始HTML的标签和布局,生成的差异HTML仍然是有效的,可以直接渲染而无需额外处理。
-
高度可定制: 通过
repeatingWordsAccuracy(重复词精度)、ignoreWhitespaceDifferences(忽略空白差异)等选项,你可以根据具体需求调整对比的严格程度,以获得最符合预期的结果。 - 简化开发流程: 开发者无需自己编写复杂的HTML解析和差异算法,只需几行代码就能实现强大的HTML版本对比功能。
-
广泛的应用场景: 除了CMS的版本控制,它还可以用于:
- 文档协作平台: 展示不同用户对同一文档的修改。
- 网站内容审计: 监控网站页面内容的变动。
- 法律文本对比: 确保合同或法律文件的修订清晰可见。
- 前端模板审查: 检查HTML模板文件在不同版本间的变化。
总而言之,ssddanbrown/htmldiff 是一个强大而实用的Composer库,它将复杂的HTML内容差异对比变得前所未有的简单和高效。如果你也曾被HTML版本对比的问题所困扰,那么强烈推荐你尝试一下这个库,它将彻底改变你的工作方式!告别那些令人头疼的HTML版本对比噩梦吧,拥抱智能、直观的差异展示!










