0

0

如何在不截取全屏的情况下精准获取网页中动态刷新的 CAPTCHA 图像

霞舞

霞舞

发布时间:2025-12-31 10:47:43

|

283人浏览过

|

来源于php中文网

原创

如何在不截取全屏的情况下精准获取网页中动态刷新的 CAPTCHA 图像

本文介绍如何使用 selenium 的 `screenshot_as_png` 属性直接截取 captcha `如何在不截取全屏的情况下精准获取网页中动态刷新的 CAPTCHA 图像` 元素的渲染图像(而非重新请求 url),从而确保获取页面当前显示的、唯一的验证码图片,适用于 ocr 识别场景。

在自动化登录或表单提交过程中,CAPTCHA 图像通常通过动态生成的 URL(如 https://rds3.northsouth.edu/index.php/captcha)提供,每次 HTTP 请求都会返回一个全新、不可复现的验证码。因此,直接 GET 该 URL 获取的图像,与页面中实际展示的 CAPTCHA 完全不同——这正是你遇到问题的根本原因。

正确做法是:跳过网络请求,直接捕获浏览器已渲染的 如何在不截取全屏的情况下精准获取网页中动态刷新的 CAPTCHA 图像 元素像素内容。Selenium WebDriver 提供了 screenshot_as_png(Python)或 getScreenshotAs(OutputType.FILE)(Java)等原生能力,可对任意 WebElement 进行局部截图,且该截图反映的是 DOM 当前状态下的真实渲染结果,完全规避了服务端动态生成带来的不一致性。

以下是完整、可运行的 Python 实现流程(基于 Selenium 4+、OpenCV、pytesseract):

X Detector
X Detector

最值得信赖的多语言 AI 内容检测器

下载
from selenium import webdriver
from selenium.webdriver.common.by import By
import cv2
import numpy as np
import pytesseract
import matplotlib.image as mpimg

# 初始化驱动(以 Chrome 为例)
driver = webdriver.Chrome()
driver.get("https://rds3.northsouth.edu/login")  # 替换为实际登录页URL

# 定位 CAPTCHA 图片元素(根据实际 ID 或 XPath 调整)
captcha_img = driver.find_element(By.ID, "captcha-img")  # 或 By.XPATH: '//img[@id="captcha-img"]'

# ✅ 关键步骤:直接截取该 img 元素的渲染图像(字节流)
png_bytes = captcha_img.screenshot_as_png

# 保存为本地文件(可选,便于调试)
with open("captcha.png", "wb") as f:
    f.write(png_bytes)

# 使用 OpenCV 加载并预处理图像(注意:screenshot_as_png 返回 BGR 格式 PNG)
nparr = np.frombuffer(png_bytes, np.uint8)
img = cv2.imdecode(nparr, cv2.IMREAD_COLOR)

# 灰度化 → 放大 → 二值化(增强 OCR 可读性)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
h, w = gray.shape
resized = cv2.resize(gray, (w * 2, h * 2))
_, binary = cv2.threshold(resized, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# OCR 识别(确保已安装 tesseract-ocr 并配置环境变量)
captcha_text = pytesseract.image_to_string(binary, config='--psm 8 -c tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyz').strip()
print("识别结果:", captcha_text)

# 填入表单(示例)
driver.find_element(By.ID, "captcha-input").send_keys(captcha_text)

核心优势说明

  • screenshot_as_png 是浏览器端渲染快照,不受服务端随机种子/Session 绑定影响;
  • 无需额外 HTTP 请求,避免触发反爬机制或消耗无效验证码配额;
  • 支持任意复杂样式(如叠加噪点、扭曲、透明背景),只要视觉上可辨即可处理。

⚠️ 注意事项

  • 确保 CAPTCHA 如何在不截取全屏的情况下精准获取网页中动态刷新的 CAPTCHA 图像 元素在视口内(可调用 captcha_img.location_once_scrolled_into_view);
  • 若页面使用 Canvas 渲染 CAPTCHA,则 screenshot_as_png 仍有效,但需确认 Canvas 是否被跨域策略阻断(通常静态资源无此问题);
  • pytesseract 识别效果高度依赖图像质量,建议结合 cv2.morphologyEx、自适应阈值等进一步优化预处理流程;
  • 生产环境请添加异常处理(如元素未找到、OCR 为空、超时重试等)。

总结:永远不要通过重复请求 CAPTCHA URL 来获取图像——它天生就是“一次性的”。唯一可靠的方式,是抓取浏览器此刻正在显示的那个 如何在不截取全屏的情况下精准获取网页中动态刷新的 CAPTCHA 图像 元素的渲染帧。 这一原则同样适用于其他动态内容(如实时图表、水印文本等)。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
session失效的原因
session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍:1、会话超时:服务器为Session设置了一个默认的超时时间,当用户在一段时间内没有与服务器交互时,Session将自动失效;2、会话数量限制:服务器为每个用户的Session数量设置了一个限制,当用户创建的Session数量超过这个限制时,最新的会覆盖最早的等等。

334

2023.10.17

session失效解决方法
session失效解决方法

session失效通常是由于 session 的生存时间过期或者服务器关闭导致的。其解决办法:1、延长session的生存时间;2、使用持久化存储;3、使用cookie;4、异步更新session;5、使用会话管理中间件。

775

2023.10.18

cookie与session的区别
cookie与session的区别

本专题整合了cookie与session的区别和使用方法等相关内容,阅读专题下面的文章了解更详细的内容。

97

2025.08.19

DOM是什么意思
DOM是什么意思

dom的英文全称是documentobjectmodel,表示文件对象模型,是w3c组织推荐的处理可扩展置标语言的标准编程接口;dom是html文档的内存中对象表示,它提供了使用javascript与网页交互的方式。想了解更多的相关内容,可以阅读本专题下面的文章。

4290

2024.08.14

html5动画制作有哪些制作方法
html5动画制作有哪些制作方法

html5动画制作方法有使用CSS3动画、使用JavaScript动画库、使用HTML5 Canvas等。想了解更多html5动画制作方法相关内容,可以阅读本专题下面的文章。

549

2023.10.23

http500解决方法
http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

495

2023.11.09

http请求415错误怎么解决
http请求415错误怎么解决

解决方法:1、检查请求头中的Content-Type;2、检查请求体中的数据格式;3、使用适当的编码格式;4、使用适当的请求方法;5、检查服务器端的支持情况。更多http请求415错误怎么解决的相关内容,可以阅读下面的文章。

449

2023.11.14

HTTP 503错误解决方法
HTTP 503错误解决方法

HTTP 503错误表示服务器暂时无法处理请求。想了解更多http错误代码的相关内容,可以阅读本专题下面的文章。

3480

2024.03.12

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

4

2026.03.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.2万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号