0

0

c++中如何实现字符串的URL编码_c++对特殊字符进行转义的方法【汇总】

尼克

尼克

发布时间:2026-01-27 11:31:02

|

624人浏览过

|

来源于php中文网

原创

必须编码的字符是除A-Z、a-z、0-9及-_.~以外的所有字符;空格须编码为%20,UTF-8字节流按字节处理,不可用std::isalnum或重复编码,推荐使用Boost.URL等成熟库。

c++中如何实现字符串的url编码_c++对特殊字符进行转义的方法【汇总】

URL 编码(Percent-encoding)在 C++ 中没有标准库函数直接支持,必须手动实现或借助第三方库;标准 std::string 不提供 encodeURIComponent 类能力,所有非字母数字字符(除 -_.~ 外)都需转为 %XX 形式。

哪些字符必须被编码?

根据 RFC 3986,URL 中仅以下字符被视为“未保留”(unreserved),可不编码:

  • 大写/小写字母:A-Za-z
  • 数字:0-9
  • 特殊符号:-_.~

其余所有字符(包括空格、中文、/?=&#、控制字符等)都应被编码。注意: (空格)必须转为 %20,不是 + —— 后者是 application/x-www-form-urlencoded 的规则,不适用于通用 URL 编码。

手写 URL 编码函数(C++11+)

核心逻辑:遍历每个字节,判断是否属于 unreserved 字符;若否,则用 % + 两位十六进制大写表示该字节值。注意:此实现针对 UTF-8 编码的字符串(现代 C++ 项目默认假设),不做 Unicode 码点拆分,直接按字节处理。

立即学习C++免费学习笔记(深入)”;

std::string url_encode(const std::string& s) {
    std::string result;
    result.reserve(s.size() * 3); // 最坏情况:每个字节变成 %XX
    for (unsigned char c : s) {
        if ((c >= 'A' && c <= 'Z') ||
            (c >= 'a' && c <= 'z') ||
            (c >= '0' && c <= '9') ||
            c == '-' || c == '_' || c == '.' || c == '~') {
            result += c;
        } else {
            result += '%';
            result += "0123456789ABCDEF"[c >> 4];
            result += "0123456789ABCDEF"[c & 15];
        }
    }
    return result;
}

使用示例:

Peppertype.ai
Peppertype.ai

高质量AI内容生成软件,它通过使用机器学习来理解用户的需求。

下载
std::string raw = "hello 世界?key=value&sub=path/to";
std::string encoded = url_encode(raw); // → "hello%20%E4%B8%96%E7%95%8C?key=value&sub=path/to"

⚠️ 注意:%E4%B8%96%E7%95%8C 是 UTF-8 字节序列的编码结果,不是 UTF-16 或其他编码。若输入不是合法 UTF-8(如 GBK 字符串混入),结果将错误且不可逆。

常见错误与兼容性陷阱

实际项目中容易踩的坑:

  • std::isalnum(c) 不能直接用:它依赖当前 locale,可能把非 ASCII 字母(如 é、α)判为 alnum,导致漏编码
  • 误用 std::hex + std::stringstream:易引入前导空格、大小写混乱、性能差,且难以控制两位固定宽度
  • 对已编码字符串重复编码:例如 %20 再次编码成 %2520,造成双编码污染
  • 混淆 URL 编码与 form 表单编码:后者把空格转 +,且不编码 *' 等字符;二者不可互换
  • 忽略路径分隔符语义:如 / 在路径段中通常不编码(它是分隔符),但在查询参数值中必须编码(如 ?q=a/b 应为 ?q=a%2Fb

更安全的替代方案:用成熟库

若项目允许引入依赖,推荐:

  • cpp-httplib:轻量,含 detail::encode_url(内部函数,需复制或封装)
  • Boost.URL(v1.83+):提供 boost::urls::encode,支持按 component(scheme、path、query 等)精细编码,自动处理 UTF-8 边界
  • cprlibcurl:其 C 接口有 curl_easy_escape,但已标记为 deprecated;新代码应避免

Boost 示例(需链接 boost_url):

boost::urls::result<boost::urls::url> u = boost::urls::parse_uri("https://ex.com/q?k=v w");
auto encoded = boost::urls::encode(u.value().params().begin()->value, boost::urls::pct_encode_opts{}); // → "v%20w"

真正难的不是写一个能跑的编码函数,而是确保它在所有边界场景下——比如混合中日韩文字、emoji、NUL 字节、代理对(surrogate pairs)缺失、locale 切换时——行为一致且符合 RFC。多数业务代码其实只需要对 query 参数值做编码,此时明确限定输入范围 + 单字节处理,比追求“全 Unicode 支持”更可靠。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.08.02

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

651

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1228

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1205

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

193

2025.07.29

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
手把手实现数据传输编码
手把手实现数据传输编码

共1课时 | 770人学习

PHP自制框架
PHP自制框架

共8课时 | 0.6万人学习

【李炎恢】ThinkPHP8.x 后端框架课程
【李炎恢】ThinkPHP8.x 后端框架课程

共50课时 | 4.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号