0

0

Python 如何批量处理文件名中的非法字符(Windows 兼容)

冷漠man

冷漠man

发布时间:2026-01-17 22:07:10

|

492人浏览过

|

来源于php中文网

原创

windows批量重命名含非法字符文件有五种安全方法:一、用python正则替换;二、用pathlib+translate高效处理;三、带时间戳备份日志;四、仅扫描不修改的预检;五、用shutil.copy2保留元数据复制。

python 如何批量处理文件名中的非法字符(windows 兼容)

如果您需要在 Windows 系统中批量重命名文件,但文件名中包含系统禁止使用的字符(如 : " / | ? *),则可能导致文件无法创建、保存或同步。以下是多种安全、可逆的处理方法:

一、使用 Python 的 os 和 re 模块替换非法字符

该方法通过正则表达式识别并统一替换 Windows 文件系统禁止的字符,保留原始文件结构,适用于大多数脚本化场景。

1、导入 os 和 re 模块:
import os
import re

2、定义非法字符正则模式及替换规则:
illegal_chars = r'[:"/\|?*]'
replacement = '_'

立即学习Python免费学习笔记(深入)”;

3、指定目标目录路径:
target_dir = r"C:your olderpath"

4、遍历目录内所有文件,对文件名执行替换并重命名:
for filename in os.listdir(target_dir):
  new_name = re.sub(illegal_chars, replacement, filename)
  if new_name != filename:
    old_path = os.path.join(target_dir, filename)
    new_path = os.path.join(target_dir, new_name)
    os.rename(old_path, new_path)

二、使用 pathlib 与字符串 translate 方法处理

该方法利用字符串的 translate 表高效映射非法字符,避免正则开销,适合大量小文件处理,且支持预设字符映射策略。

1、导入 pathlib 和 string:
from pathlib import Path
import string

2、构建 Windows 非法字符映射表:
illegal_map = str.maketrans({c: '_' for c in ':"/\|?*'})

3、设置根路径对象:
root = Path(r"C:your olderpath")

4、递归获取所有文件路径:
for file_path in root.rglob('*'):
  if file_path.is_file():

5、生成新文件名并执行重命名:
    stem = file_path.stem.translate(illegal_map)
    suffix = file_path.suffix
    new_name = f"{stem}{suffix}"
    new_path = file_path.parent / new_name
    if new_path != file_path and not new_path.exists():
      file_path.rename(new_path)

三、保留原始文件名备份并添加时间戳前缀

该方法在重命名前自动备份原文件名至日志,并为新文件添加唯一标识,确保操作可追溯,强烈建议在生产环境首次运行时启用此方案

1、导入 datetime 模块用于生成时间戳:
from datetime import datetime

ColorMagic
ColorMagic

AI调色板生成工具

下载

2、创建日志文件记录映射关系:
log_path = Path(r"C:your olderpath ename_log.txt")
with open(log_path, "a", encoding="utf-8") as log:
  log.write(f" === Batch rename at {datetime.now()} === ")

3、对每个文件执行带日志的重命名:
for file_path in Path(r"C:your olderpath").iterdir():
  if file_path.is_file():
    original_name = file_path.name
    cleaned_name = re.sub(r'[:"/\|?*]', '_', original_name)

4、写入日志并执行重命名:
    with open(log_path, "a", encoding="utf-8") as log:
      log.write(f"{original_name} → {cleaned_name} ")
    if cleaned_name != original_name:
      new_path = file_path.parent / cleaned_name
      file_path.rename(new_path)

四、过滤并跳过已含非法字符的文件名(仅校验不修改)

该方法不执行任何重命名操作,仅扫描并输出含非法字符的文件路径,适用于审计或预检查阶段,避免误操作导致数据混乱

1、定义非法字符集合:
illegal_set = set(':"/\|?*')

2、指定扫描路径:
scan_dir = Path(r"C:your olderpath")

3、遍历所有文件并检查文件名是否含非法字符:
for file_path in scan_dir.rglob('*'):
  if file_path.is_file():
    name_chars = set(file_path.name)
    if name_chars & illegal_set:

4、打印违规文件路径:
      print(f"Invalid chars found: {file_path}")

五、使用 shutil.copy2 保留元数据并重命名副本

该方法不直接修改原文件,而是创建合规命名的副本并保留修改时间、访问时间等元数据,适用于需严格保持原始文件状态的场景。

1、导入 shutil 和 os:
import shutil
import os

2、定义非法字符替换函数:
def sanitize_name(name):
  return re.sub(r'[:"/\|?*]', '_', name)

3、设定源目录和副本输出目录:
src_dir = Path(r"C:yoursourcepath")
dst_dir = Path(r"C:youroutputpath")
dst_dir.mkdir(exist_ok=True)

4、对每个文件生成合规副本:
for file_path in src_dir.iterdir():
  if file_path.is_file():
    clean_name = sanitize_name(file_path.name)
    dst_file = dst_dir / clean_name

5、复制并保留全部文件属性:
    if dst_file != file_path:
      shutil.copy2(file_path, dst_file)

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

530

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

258

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

766

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

219

2023.08.11

正则表达式空格
正则表达式空格

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容,供大家免费下载体验。

356

2023.08.31

Python爬虫获取数据的方法
Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据,或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示
正则表达式空格如何表示

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容,可以访问下面的文章。

244

2023.11.17

正则表达式中如何匹配数字
正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

547

2023.12.06

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.9万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号