0

0

如何批量验证文件夹下所有XML文件的格式? 编写一个简单的验证脚本(Python/Shell)

幻夢星雲

幻夢星雲

发布时间:2025-12-01 16:41:02

|

687人浏览过

|

来源于php中文网

原创

使用Python或Shell脚本可批量验证XML文件格式:① Python脚本通过xml.etree.ElementTree解析文件,输出每个文件的验证结果并统计失败数;② Shell脚本调用xmllint工具检查语法,需先安装libxml2,运行后显示有效无效文件及总数。

如何批量验证文件夹下所有xml文件的格式? 编写一个简单的验证脚本(python/shell)

如何批量验证文件夹下所有 XML 文件的格式?

可以使用 Python 或 Shell 脚本快速检查指定文件夹中所有 XML 文件是否格式正确。以下提供两个简单实用的方案。

✅ 使用 Python 脚本验证

Python 内置 xml.etree.ElementTree 模块,能轻松解析和验证 XML 格式。

立即学习Python免费学习笔记(深入)”;

validate_xml.py

import os
import sys
import xml.etree.ElementTree as ET

def validate_xml_file(filepath):
    try:
        ET.parse(filepath)
        print(f"✅ 有效: {filepath}")
        return True
    except ET.ParseError as e:
        print(f"❌ 无效: {filepath} | 错误: {e}")
        return False

def validate_xml_folder(folder_path):
    if not os.path.isdir(folder_path):
        print(f"错误:'{folder_path}' 不是一个有效的目录")
        return

    xml_files = [f for f in os.listdir(folder_path) if f.lower().endswith('.xml')]

    if not xml_files:
        print("⚠️  在目录中未找到 XML 文件")
        return

    failed = 0
    for filename in xml_files:
        filepath = os.path.join(folder_path, filename)
        if not validate_xml_file(filepath):
            failed += 1

    print(f"\n验证完成:共 {len(xml_files)} 个文件,{failed} 个失败")

if __name__ == "__main__":
    if len(sys.argv) != 2:
        print("用法: python validate_xml.py <文件夹路径>")
    else:
        validate_xml_folder(sys.argv[1])

? 保存为 validate_xml.py,运行方式:
python validate_xml.py /path/to/xml/files

✅ 使用 Shell 脚本(搭配 xmllint)

Linux/macOS 可使用 xmllint 工具(来自 libxml2),轻量高效。

Rose.ai
Rose.ai

一个云数据平台,帮助用户发现、可视化数据

下载

立即学习Python免费学习笔记(深入)”;

validate_xml.sh

#!/bin/bash

# 检查是否安装 xmllint
if ! command -v xmllint &> /dev/null; then
    echo "错误: xmllint 未安装,请先安装 libxml2"
    exit 1
fi

# 检查传入参数
if [ -z "$1" ]; then
    echo "用法: $0 <XML文件夹路径>"
    exit 1
fi

XML_DIR="$1"

if [ ! -d "$XML_DIR" ]; then
    echo "错误: 目录 '$XML_DIR' 不存在"
    exit 1
fi

echo "开始验证 XML 文件..."
failed=0

for file in "$XML_DIR"/*.xml "$XML_DIR"/*.XML; do
    if [ ! -f "$file" ]; then
        continue
    fi
    if xmllint --noout "$file" > /dev/null 2>&1; then
        echo "✅ 有效: $file"
    else
        echo "❌ 无效: $file"
        failed=$((failed + 1))
    fi
done

echo
echo "验证完成:共处理文件 $(ls "$XML_DIR"/*.xml 2>/dev/null | wc -l), $failed 个格式错误"

exit $failed

? 保存为 validate_xml.sh,运行前加权限:
chmod +x validate_xml.sh
./validate_xml.sh /path/to/xml/files

? 补充说明

Python 方案无需额外依赖,适合大多数环境;Shell 方案依赖 xmllint,但执行更快。两者都能准确识别语法错误如标签不闭合、非法字符、编码问题等。

基本上就这些,按需选择即可。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1949

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1171

2024.11.28

macOS怎么切换用户账户
macOS怎么切换用户账户

在 macOS 系统中,可通过多种方式切换用户账户。如点击苹果图标选择 “系统偏好设置”,打开 “用户与群组” 进行切换;或启用快速用户切换功能,通过菜单栏或控制中心的账户名称切换;还能使用快捷键 “Control+Command+Q” 锁定屏幕后切换。

359

2025.05.09

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1564

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

801

2023.07.05

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.7万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号