0

0

使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程

DDD

DDD

发布时间:2025-09-15 12:36:21

|

1077人浏览过

|

来源于php中文网

原创

使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程

本教程详细介绍了如何在PHP中实现图片相似度比对,以解决传统MD5哈希无法识别相似图片的问题。通过引入第三方感知哈希库,我们能够计算上传图片与目标目录下所有图片的相似度,并根据设定的阈值筛选并展示相似图片。教程涵盖了从HTML表单到PHP处理逻辑、代码示例、关键注意事项及性能优化建议,帮助开发者构建高效的图片相似度识别功能。

挑战与传统方法的局限性

在web开发中,我们经常遇到需要识别图片相似性的场景,例如防止重复上传、内容推荐或查找视觉相似的商品。传统的图片比对方法,如计算图片的md5哈希值,只能识别完全相同的图片。即使图片经过轻微的压缩、裁剪或尺寸调整,其md5哈希值也会发生巨大变化,导致无法识别其视觉上的相似性。因此,我们需要一种更智能的方法来衡量图片之间的“感知”相似度。

核心原理:感知哈希(Perceptual Hashing)

感知哈希(Perceptual Hashing,简称pHash)是一种通过算法提取图片视觉特征并生成一个“指纹”(哈希值)的技术。与MD5等加密哈希不同,感知哈希的特点是:即使图片经过轻微修改(如缩放、亮度调整、裁剪等),其生成的哈希值也只会发生微小变化。通过比较两个感知哈希值之间的差异(通常是汉明距离),我们可以量化两张图片视觉上的相似程度。差异越小,图片越相似。

引入图片比对库

为了在PHP中实现感知哈希比对,我们可以利用现有的第三方库。本教程将以nvthaovn/CompareImage这个GitHub仓库中提供的compareImages.php类为例。这个类封装了感知哈希的计算逻辑,简化了图片比对过程。

准备工作:

  1. 下载compareImages.php文件,并将其放置在您的项目目录中,确保PHP脚本可以正确引用。
  2. 确保您的PHP环境已安装并启用了GD库(或其他图像处理扩展,如ImageMagick),因为compareImages.php通常会依赖这些库来处理图片。

实现步骤

下面我们将分步介绍如何构建一个功能,允许用户上传图片,然后将其与服务器上指定目录中的所有图片进行比对,并显示相似的图片。

立即学习PHP免费学习笔记(深入)”;

1. HTML表单准备

首先,创建一个简单的HTML表单,用于用户上传图片。




    图片相似度比对


    

2. PHP处理逻辑

接下来是PHP脚本,它将处理文件上传、实例化比对类、遍历目录并执行比对。

PNG Maker
PNG Maker

利用 PNG Maker AI 将文本转换为 PNG 图像。

下载
上传图片:";
            echo "@@##@@
"; echo "

相似图片:

"; try { // 实例化图片比对器,传入上传图片的路径 $compareMachine = new compareImages($uploadedImagePath); // 获取待比对目录下的所有图片文件 // 仅获取常见图片格式,可根据需要扩展 $imagesToCompare = glob($compareDir . "*.{jpg,jpeg,png,gif}", GLOB_BRACE); $similarImagesFound = false; foreach ($imagesToCompare as $image) { // 排除上传文件自身(如果上传目录和比对目录相同) if (realpath($image) === realpath($uploadedImagePath)) { continue; } // 执行比对,获取差异值 $diff = $compareMachine->compareWith($image); // 设置相似度阈值。diff值越小表示越相似。 // 21 是一个经验值,可根据实际需求调整。 if ($diff < 21) { echo "@@##@@"; $similarImagesFound = true; } } if (!$similarImagesFound) { echo "

未找到相似图片。

"; } } catch (Exception $e) { echo "

比对过程中发生错误:" . $e->getMessage() . "

"; } } else { echo "

文件上传失败,请检查目录权限。

"; } } else { echo "

请选择一个图片文件进行上传。

"; // 详细错误信息 // echo "

错误代码: " . $_FILES['file']['error'] . "

"; } } ?>

注意事项与优化

  1. 相似度阈值 ($diff

    • compareImages库返回的$diff值代表两个感知哈希之间的差异。值越小,图片越相似。
    • 21是一个经验值,表示图片具有较高的相似度。您可以根据实际应用场景和对相似度的容忍程度来调整这个阈值。例如,如果需要更严格的相似度,可以降低阈值(如10);如果允许更大差异,可以提高阈值(如30)。
  2. 性能考虑:

    • 大量图片比对: 如果img/目录包含成千上万张图片,每次请求都对所有图片进行哈希计算和比对会非常耗时。
    • 优化策略:
      • 预计算哈希: 在图片上传到img/目录时,提前计算其感知哈希值并存储到数据库或文件中。比对时,只需加载这些预计算的哈希值进行比较,而不是每次都重新处理图片文件。
      • 索引: 对于非常大的数据集,可以考虑使用专门的图像搜索引擎或库(如Elasticsearch结合插件)来索引和查询图像特征。
      • 缓存: 对比对结果进行缓存,避免重复计算。
  3. 错误处理与安全性:

    • 文件上传: 始终对上传的文件进行严格的验证,包括文件类型(MIME类型和扩展名)、文件大小、文件内容(防止上传恶意脚本)。
    • 目录权限: 确保upload/和img/目录具有正确的写入权限,否则文件上传和处理会失败。
    • 库文件缺失: 确保compareImages.php文件存在且可访问。
    • 异常处理: 使用try-catch块捕获compareImages类可能抛出的异常,如图片文件损坏或GD库问题。
  4. 图片格式支持:

    • compareImages.php库通常依赖PHP的GD库或ImageMagick扩展来处理图片。确保您的服务器环境支持所需的图片格式(JPEG, PNG, GIF等)。
    • glob()函数中的*.{jpg,jpeg,png,gif}可以根据需要添加或移除支持的图片格式。

总结

通过引入感知哈希(Perceptual Hashing)技术和相应的PHP库,我们能够有效地解决传统MD5哈希在图片相似度识别方面的局限性。本教程提供了一个基于compareImages.php库的实用方案,实现了用户上传图片与目录中现有图片的相似度比对与展示。在实际应用中,务必关注性能优化、安全性以及灵活调整相似度阈值,以构建健壮且高效的图片相似度识别系统。

使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

815

2026.01.21

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

407

2023.08.14

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

358

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2082

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

349

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

256

2023.09.05

vb中怎么连接access数据库
vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容,供大家免费下载体验。

326

2023.10.09

数据库对象名无效怎么解决
数据库对象名无效怎么解决

数据库对象名无效解决办法:1、检查使用的对象名是否正确,确保没有拼写错误;2、检查数据库中是否已存在具有相同名称的对象,如果是,请更改对象名为一个不同的名称,然后重新创建;3、确保在连接数据库时使用了正确的用户名、密码和数据库名称;4、尝试重启数据库服务,然后再次尝试创建或使用对象;5、尝试更新驱动程序,然后再次尝试创建或使用对象。

412

2023.10.16

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 9.9万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号