0

0

Excel VBA 中实现网页数据抓取的完整教程

心靈之曲

心靈之曲

发布时间:2026-03-08 18:14:18

|

507人浏览过

|

来源于php中文网

原创

Excel VBA 中实现网页数据抓取的完整教程

本文详解如何在 excel vba 中正确调用 msxml 和 htmldocument 对象抓取网页价格等结构化数据,重点解决运行时错误 424(对象未设置)、html 对象未初始化、响应内容未载入 dom 等常见陷阱,并提供可直接运行的健壮示例代码。

本文详解如何在 excel vba 中正确调用 msxml 和 htmldocument 对象抓取网页价格等结构化数据,重点解决运行时错误 424(对象未设置)、html 对象未初始化、响应内容未载入 dom 等常见陷阱,并提供可直接运行的健壮示例代码。

在 Excel 中通过 VBA 实现网页数据自动采集(Web Scraping),是财务监控、比价分析或行情跟踪等场景下的实用技能。但初学者常因对象生命周期管理不当而遭遇 Run-time error '424': Object required —— 这一错误几乎总是源于 HTMLDocument 对象未正确加载响应内容,而非选择器本身错误。

回顾原始代码,存在两个关键缺陷:

  1. 变量名拼写错误:Dim htlm As New HTMLDocument → 应为 html(少了一个 l),导致后续 html.body.innerHTML = response 无法执行;
  2. 响应文本(response)未注入 HTML DOM:StrConv(...) 仅生成 Unicode 字符串,但 HTMLDocument 对象仍是空壳,必须显式调用 html.body.innerHTML = response 才能构建可查询的 DOM 树。

以下是修复后的完整、健壮、带错误处理的 VBA 实现:

科大讯飞-AI虚拟主播
科大讯飞-AI虚拟主播

科大讯飞推出的移动互联网智能交互平台,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析;

下载
Sub Get_Web_Data()
    Dim request As Object
    Dim response As String
    Dim html As New HTMLDocument  ' ✅ 修正拼写:htlm → html
    Dim website As String
    Dim priceElement As Object
    Dim price As String

    website = "https://www.taptools.io/portfolio"

    ' 创建 HTTP 请求对象
    Set request = CreateObject("MSXML2.XMLHTTP")
    request.Open "GET", website, False
    request.setRequestHeader "User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36"
    request.send

    ' 检查请求状态
    If request.Status <> 200 Then
        MsgBox "HTTP 请求失败,状态码:" & request.Status & vbCrLf & request.statusText
        Exit Sub
    End If

    ' 将二进制响应体转为 Unicode 字符串,并注入 HTML DOM
    response = StrConv(request.responseBody, vbUnicode)
    html.body.innerHTML = response  ' ✅ 关键步骤:必须赋值才能使用 getElementsByClassName

    ' 安全获取元素(避免索引越界)
    Set priceElement = html.getElementsByClassName("portfolio__table__content__right-align portfolio__table__content__stack portfolio__table__content__price")(0)
    If Not priceElement Is Nothing Then
        price = Trim(priceElement.innerText)
        MsgBox "抓取到价格:" & price
        ' 示例:写入工作表 A1 单元格
        ThisWorkbook.Sheets(1).Range("A1").Value = price
    Else
        MsgBox "⚠️ 未找到匹配的价格元素,请检查 CSS 类名是否准确或页面结构是否已变更。"
    End If
End Sub

重要注意事项:

  • 引用设置:需在 VBA 编辑器中启用「Microsoft HTML Object Library」(Tools → References → 勾选 Microsoft HTML Object Library);
  • 类名准确性:目标网站若使用动态渲染(如 React/Vue),静态 HTML 解析将失效——此时应改用 SeleniumBasic 或浏览器自动化方案;
  • 反爬策略:部分网站校验 User-Agent 或拒绝非浏览器请求,务必通过 setRequestHeader 模拟真实浏览器;
  • 稳定性增强:生产环境建议添加超时控制(request.setTimeouts 5000, 5000, 10000, 10000)及 On Error Resume Next + 显式错误检查;
  • ⚠️ 法律与合规:请务必查阅目标网站 robots.txt 及服务条款,避免高频请求或抓取受版权保护的数据。

掌握这一模式后,你可轻松扩展至抓取多元素(如产品名称、日期、涨跌幅),并结合定时宏实现全自动数据看板。核心始终不变:正确初始化对象 → 安全注入响应 → 精准定位节点 → 健壮异常处理

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

472

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

375

2023.10.25

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

739

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

220

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1563

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

649

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1188

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1184

2024.04.29

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

59

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 20.6万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号