0

0

c++中如何判断路径是否存在非法字符_c++文件名有效性检查【详解】

尼克

尼克

发布时间:2026-01-20 10:38:02

|

209人浏览过

|

来源于php中文网

原创

Windows路径非法字符包括: " / \ | ? *、ASCII控制字符(0x00–0x1F)及结尾空格/点,设备名如CON/PRN/AUX/NUL(不区分大小写,含扩展名或尾部空格)也非法;std::filesystem不校验字符合法性,需手动预检。

c++中如何判断路径是否存在非法字符_c++文件名有效性检查【详解】

Windows 下 C++ 判断路径是否含非法字符

Windows 对文件名和路径有明确的保留字符集,CreateFilestd::filesystem::create_directories 等调用失败时,往往不是因为权限或磁盘满,而是路径里混入了系统禁止使用的字符。这些字符不报“非法字符”错误,只返回 ERROR_INVALID_NAME 或抛出 std::filesystem::filesystem_error,排查起来很隐晦。

核心非法字符包括: > : " / \ | ? *,以及 ASCII 控制字符(0x00–0x1F)和结尾空格/点(如 "file. ""con." 这类设备名变体)。

  • 使用 std::filesystem::path 时,path::string()path::u8string() 返回的字符串需逐字符检查,不能依赖 path::has_filename() 等接口判断合法性
  • 注意 std::filesystem 在 C++17 中不校验字符合法性,它只做路径解析;真正触发校验的是系统 API 调用(如 exists()create_directories()
  • 设备名如 "CON""PRN""AUX""NUL" 及其加扩展名或后缀空格的形式("CON.txt""CON ")也属于非法,需额外比对(不区分大小写)

跨平台文件名有效性检查函数怎么写

Linux/macOS 对文件名限制极小(仅禁止 /\0),但为统一行为、避免 Windows 上静默失败,建议在所有平台都执行 Windows 风格的预检——尤其当程序目标是双平台部署或生成用户可下载的文件时。

一个轻量、无依赖的检查函数示例:

立即学习C++免费学习笔记(深入)”;

Muse AI
Muse AI

下一代无广告视频托管平台

下载
bool is_valid_filename(const std::string& name) {
    if (name.empty()) return false;

    // 检查控制字符和 Windows 非法字符
    for (unsigned char c : name) {
        if (c == 0 || c <= 0x1F || c == '"' || c == '<' || c == '>' || 
            c == '|' || c == '?' || c == '*' || c == ':' || c == '/' || c == '\\') {
            return false;
        }
    }

    // 检查结尾空格或点(Windows 会截断,导致重名)
    if (name.back() == ' ' || name.back() == '.') return false;

    // 检查设备名(不区分大小写,忽略扩展名和尾部空格)
    static const std::vector reserved = {"con", "prn", "aux", "nul",
                                                       "com1", "com2", "com3", "com4",
                                                       "com5", "com6", "com7", "com8",
                                                       "com9", "lpt1", "lpt2", "lpt3",
                                                       "lpt4", "lpt5", "lpt6", "lpt7",
                                                       "lpt8", "lpt9"};
    std::string lower = name;
    std::transform(lower.begin(), lower.end(), lower.begin(), ::tolower);
    size_t dot_pos = lower.find('.');
    std::string base = dot_pos != std::string::npos ? lower.substr(0, dot_pos) : lower;
    // 去除 base 末尾空格
    base.erase(base.find_last_not_of(' ') + 1);
    if (std::find(reserved.begin(), reserved.end(), base) != reserved.end()) {
        return false;
    }

    return true;
}

该函数不检查路径长度(MAX_PATH)、驱动器前缀或 UNC 路径结构,仅聚焦于「单个文件名片段」的字符有效性。若用于完整路径,需先用 std::filesystem::path::filename() 提取最后一段再传入。

std::filesystem::path::has_filename() 为什么不能代替字符检查

has_filename() 只判断路径对象是否包含非空文件名组件(即是否有类似 "foo.txt" 的部分),完全不涉及内容合法性。例如:std::filesystem::path("a 会成功构造,.has_filename() 返回 true,但后续调用 .exists() 就会抛异常。

  • std::filesystem::path 构造函数不做任何验证,它只是字符串切分器
  • path::native()path::generic_string() 输出的字符串仍含非法字符,直接传给 CreateFileA 必然失败
  • 想提前发现风险,必须在构造 path 后、调用 IO 函数前,对其 filename().string() 执行独立字符扫描

实际项目中容易漏掉的三个点

很多团队在做文件保存逻辑时,只校验空值或长度,却忽略这些细节:

  • 用户输入的文件名可能带 Unicode BOM 或零宽空格(\u200B),它们不可见但属于非法控制字符,需在检查前用 std::erase_if(str, [](char c) { return static_cast(c) 清理
  • Web 表单提交的文件名经过 URL 解码后可能还原出 %00%2F,服务端未 decode 就拼接路径,会导致看似合法实则含 \0/
  • 日志或配置中硬编码的路径模板(如 "logs/{date}.log")若 {date} 插入了非法字符(如用户可控的日期格式含冒号),整个路径就失效——这类问题不会在编译期暴露,只能靠运行时检查

最稳妥的做法:所有外部输入的文件名,在组装进 std::filesystem::path 前,强制过一遍字符白名单过滤(只保留字母、数字、下划线、短横、点),而不是依赖事后异常捕获。毕竟,文件操作失败的成本远高于一次字符串扫描。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

318

2023.08.02

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

318

2023.08.02

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

258

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

209

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1468

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

620

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

550

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

545

2024.04.29

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

8

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号