0

0

如何在不截全屏的前提下精准获取页面中动态刷新的 CAPTCHA 图像

花韻仙語

花韻仙語

发布时间:2025-12-31 15:07:02

|

528人浏览过

|

来源于php中文网

原创

如何在不截全屏的前提下精准获取页面中动态刷新的 CAPTCHA 图像

本文介绍一种基于 selenium 元素级截图 + opencv 预处理 + pytesseract ocr 的可靠方案,直接捕获当前页面渲染的 captcha 图像(非重新请求 url),确保获取的是用户所见即所得的实时验证码。

在自动化登录场景中,许多网站(如 rds3.northsouth.edu)采用服务端动态生成的 CAPTCHA,其 如何在不截全屏的前提下精准获取页面中动态刷新的 CAPTCHA 图像 标签的 src 指向一个每次请求都返回新图片的 URL(例如 https://rds3.northsouth.edu/index.php/captcha)。这意味着:通过 get_attribute('src') 再用 requests.get() 下载,得到的必然是新生成的、与页面当前显示不一致的验证码——这正是你遇到的核心问题。

✅ 正确解法是:跳过网络请求,直接从浏览器渲染缓冲区中提取该 如何在不截全屏的前提下精准获取页面中动态刷新的 CAPTCHA 图像 元素当前实际显示的像素数据。Selenium 提供了 screenshot_as_png 属性,它对 WebElement 调用时,会精确截取该元素在视口中的渲染快照(含 CSS 缩放、滤镜等效果),完全规避服务端重生成逻辑。

一帧秒创
一帧秒创

基于秒创AIGC引擎的AI内容生成平台,图文转视频,无需剪辑,一键成片,零门槛创作视频。

下载

✅ 推荐实现步骤(Python + Selenium + OpenCV + Pytesseract)

from selenium import webdriver
from selenium.webdriver.common.by import By
import cv2
import numpy as np
import pytesseract

# 1. 定位 CAPTCHA 元素(推荐使用更现代的 find_element)
captcha_elem = driver.find_element(By.ID, "captcha-img")  # 替换为你的实际 ID 或其他定位器

# 2. 直接截取该元素的 PNG 图像(毫秒级,无网络延迟,100% 对应页面所见)
png_bytes = captcha_elem.screenshot_as_png

# 3. 保存并加载为 OpenCV 可处理的图像(可选:直接内存处理避免磁盘 I/O)
with open("captcha.png", "wb") as f:
    f.write(png_bytes)

img = cv2.imread("captcha.png")
if img is None:
    raise RuntimeError("Failed to load CAPTCHA image")

# 4. 简单但有效的预处理(提升 OCR 准确率)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
h, w = gray.shape
resized = cv2.resize(gray, (w * 2, h * 2))  # 放大便于识别
_, binary = cv2.threshold(resized, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# 可选:形态学闭运算连接断裂字符
kernel = np.ones((1, 1), np.uint8)
cleaned = cv2.morphologyEx(binary, cv2.MORPH_CLOSE, kernel)

# 5. OCR 识别(建议添加 config 提升数字/字母识别率)
text = pytesseract.image_to_string(
    cleaned, 
    config='--psm 8 -c tessedit_char_whitelist=ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
).strip().replace(" ", "")

print("Recognized CAPTCHA:", text)

⚠️ 关键注意事项

  • screenshot_as_png 是唯一可靠方式:它绕过了 HTTP 请求不确定性,直接读取浏览器已渲染的 DOM 元素像素,确保“所见即所得”。
  • 避免过早截图:务必在 CAPTCHA 图像完全加载(如等待 visibility_of_element_located)后再调用 screenshot_as_png,否则可能截到空白或 loading 占位图。
  • 环境依赖
  • OCR 效果优化:复杂 CAPTCHA(扭曲、干扰线、低对比度)需定制预处理(如去噪、二值化参数调整、字符分割),简单验证码(如本例)PSPM 8(单行文本)+ 白名单即可达 80%+ 准确率。
  • 合规提醒:请确保你对目标网站的自动化访问符合其 robots.txt 及服务条款;CAPTCHA 绕过可能违反网站政策,仅建议用于合法授权的测试或内部系统集成。

该方法稳定、高效、无需代理或逆向服务端逻辑,是处理动态 CAPTCHA 的工业级实践方案。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

436

2024.12.20

pip设置清华源
pip设置清华源

设置方法:1、打开终端或命令提示符窗口;2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件;3、打开pip.conf文件,然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容,这将把pip的镜像源设置为清华大学的镜像源;4、保存并关闭文件即可。

802

2024.12.23

python升级pip
python升级pip

本专题整合了python升级pip相关教程,阅读下面的文章了解更多详细内容。

370

2025.07.23

DOM是什么意思
DOM是什么意思

dom的英文全称是documentobjectmodel,表示文件对象模型,是w3c组织推荐的处理可扩展置标语言的标准编程接口;dom是html文档的内存中对象表示,它提供了使用javascript与网页交互的方式。想了解更多的相关内容,可以阅读本专题下面的文章。

4328

2024.08.14

github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

4109

2026.01.21

http500解决方法
http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

495

2023.11.09

http请求415错误怎么解决
http请求415错误怎么解决

解决方法:1、检查请求头中的Content-Type;2、检查请求体中的数据格式;3、使用适当的编码格式;4、使用适当的请求方法;5、检查服务器端的支持情况。更多http请求415错误怎么解决的相关内容,可以阅读下面的文章。

450

2023.11.14

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.3万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号