Selenium 自动化中精准提取聊天框响应内容的完整教程

霞舞

发布时间：2026-02-22 12:50:03

860人浏览过

来源于php中文网

原创

Selenium 自动化中精准提取聊天框响应内容的完整教程

本文详解如何在 Selenium 中稳定定位并提取动态生成的聊天机器人响应内容，重点解决因元素异步加载、结构嵌套深、CSS 类名动态导致的 find_element 失败问题，提供健壮的 XPath + CSS 组合定位策略与等待机制。

本文详解如何在 selenium 中稳定定位并提取动态生成的聊天机器人响应内容，重点解决因元素异步加载、结构嵌套深、css 类名动态导致的 `find_element` 失败问题，提供健壮的 xpath + css 组合定位策略与等待机制。

在自动化聊天界面（如基于 MUI 构建的 Copilot 风格聊天框）时，开发者常遇到“明明元素已渲染，却无法用 find_element 获取文本”的典型困境。根本原因并非代码逻辑错误，而是响应内容存在多层异步插入与 DOM 延迟填充：.css-liwoqsn 仅是容器占位符，实际

和

因此，单纯使用 presence_of_element_located 或 visibility_of_element_located 检测容器存在是不够的——必须等待目标文本节点真实可读。以下是经过生产验证的稳健方案：

标小兔AI写标书

一款专业的标书AI代写平台，提供专业AI标书代写服务，安全、稳定、速度快，可满足各类招投标需求，标小兔，写标书，快如兔。

下载

✅ 正确做法：分层等待 + 文本就绪断言

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
import time

def get_response(driver, timeout=15):
    """
    稳健获取最新一条 AI 响应文本
    使用 XPath 精准定位最上方响应容器（新消息始终在索引 1）
    并等待其内部 .content > p/ul 节点出现且非空文本
    """
    # Step 1: 等待响应容器存在（XPath 更稳定，避免 css-liwoqsn 类名漂移）
    container_xpath = '//*[@id="__next"]/main/div/span/div/div[2]/div/div/div/div[2]/div[1]'
    container = WebDriverWait(driver, timeout).until(
        EC.presence_of_element_located((By.XPATH, container_xpath))
    )

    # Step 2: 等待容器内实际内容区域（.content）及其子文本节点就绪
    content_selector = ".content.MuiBox-root.css-x97jm9"
    content_area = WebDriverWait(driver, timeout).until(
        EC.presence_of_element_located((By.CSS_SELECTOR, content_selector))
    )

    # Step 3: 等待至少一个 <p> 或 <ul> 存在且文本非空白（关键！）
    text_nodes_xpath = ".//p[normalize-space() != ''] | .//ul[.//li[normalize-space() != '']]"
    try:
        text_element = WebDriverWait(driver, timeout).until(
            EC.presence_of_element_located((By.XPATH, f"{text_nodes_xpath}"))
        )
        response_text = text_element.text.strip()
    except:
        # 降级：尝试获取整个 content 区域的合并文本（兼容纯段落无列表场景）
        response_text = content_area.text.strip()

    if not response_text:
        raise RuntimeError("Chat response is empty after waiting — check if message was sent or UI updated correctly.")

    print(f"[✓] Extracted response: {response_text[:60]}{'...' if len(response_text) > 60 else ''}")
    return response_text

⚠️ 关键注意事项

勿依赖 css-liwoqsn 定位文本：该类仅标识“响应块”，其内部结构（如 css-107u4gk）可能随版本变更；而 //div[2]/div[1] 的 XPath 路径更稳定，因其基于 DOM 层级与固定 ID（__next）。
避免 time.sleep() 替代显式等待：硬等待易导致超时或浪费时间；必须用 WebDriverWait 配合 EC.presence_of_element_located 或 EC.text_to_be_present_in_element。
警惕空白
和

：HTML 中常见

或
占位，直接 .text 会返回空字符串。务必用 normalize-space() XPath 函数或 .strip() 后校验长度。

启用页面加载等待增强鲁棒性：在 send_message() 后添加：

# 确保发送动作触发网络请求完成
WebDriverWait(driver, 10).until(lambda d: d.execute_script("return window.performance.getEntriesByType('resource').filter(r => r.name.includes('api/chat')).length > 0") or True)

✅ 最佳实践总结

场景	推荐策略
定位最新响应容器	使用绝对 XPath（含 __next ID）而非动态 CSS 类
提取有效文本	先等 .content 区域存在 → 再等 //p[normalize-space()] 或 //ul//li[normalize-space()] → 最后 .text.strip()
调试技巧	在 get_response() 开头加入 print(driver.page_source[:1000]) 快速确认当前 DOM 状态
容错设计	对 WebDriverException 做分级捕获（超时 / 元素不存在 / 文本为空），并记录截图辅助排查

通过以上方法，你将彻底摆脱“元素找到了但取不到内容”的困扰，实现高成功率的聊天响应自动化采集。

相关标签:

print 字符串 dom 异步 ul li 自动化 copilot

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：PowerShell 正则提取 HTML 字符串中第 N 个数字的完整教程下一篇：暂无

作者最新文章

Canvas 填充路径边缘缺失问题：原因分析与可靠解决方案

2026-02-21 13:02

如何使用 Kotlin 函数式编程遍历 Java 类继承链并收集所有声明字段

2026-02-21 13:10

如何在 Maven 项目中同时使用同一依赖的不同版本而不引发冲突

2026-02-21 13:20

Go 中结构体嵌入时的指针类型匹配问题详解

2026-02-21 13:23

如何使用 PHP 数组动态填充 HTML 下拉菜单（select）

2026-02-21 14:05

如何高效分页处理百万级数据的 REST API 请求

2026-02-21 14:07

如何高效更新Pandas DataFrame中的特定观测值（避免内存溢出）

2026-02-21 14:19

Python 使用 Cryptography 库解密文件时的常见错误与正确实践

2026-02-21 14:24

Golang 正则表达式支持 Unicode 字符的正确写法

2026-02-21 14:27

如何在 Django 中高效筛选排除多对多关联中任意隐藏项的书籍

2026-02-21 14:28

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

192

2023.09.27

python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容，阅读专题下面的文章了解更多详细教程。

2026.02.03

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

616

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

217

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1557

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

642

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

1006

2024.03.22