使用 sscanf 安全解析 URL 查询字符串的正确方法

碧海醫心

发布时间：2026-02-27 19:11:11

585人浏览过

来源于php中文网

原创

使用 sscanf 安全解析 URL 查询字符串的正确方法

本文详解如何用 sscanf 正确解析形如 Name=ss&Port=8081&ID=0&Config=testconfig 的 CGI 查询字符串，解决 %s 贪婪匹配导致字段越界的问题，并提供带缓冲区保护的安全格式化方案。

本文详解如何用 `sscanf` 正确解析形如 `name=ss&port=8081&id=0&config=testconfig` 的 cgi 查询字符串，解决 `%s` 贪婪匹配导致字段越界的问题，并提供带缓冲区保护的安全格式化方案。

在 C/C++ 编写的 CGI 程序中，常通过 getenv("QUERY_STRING") 获取 URL 查询参数（如 Name=ss&Port=8081&ID=0&Config=testconfig），再借助 sscanf 提取各字段。但若直接使用 %s 格式符（如 "Name=%s&Port=%d..."），会导致首个字符串字段贪婪捕获直到字符串末尾——因为 %s 默认以空白符（空格、制表符、换行）或 \0 为终止边界，而查询字符串中不含这些字符，& 对它完全“不可见”。

例如原代码：

sscanf(data, "Name=%s&Port=%d&ID=%d&Config=%s", &name, &port, &id, &config);

当输入为 Name=ss&Port=8081&ID=0&Config=testconfig 时，%s 会将 ss&Port=8081&ID=0&Config=testconfig 全部读入 name，后续字段解析失败。

✅ 正确做法是：显式指定扫描终止符。使用 [^&] 字符集格式符——%[^&] 表示“匹配任意非 & 字符”，一旦遇到 & 即停止读取，完美契合查询字符串的分隔逻辑。

同时，必须限定缓冲区长度以防溢出（name[50] 最多存 49 字符 + 1 个 \0）。最终安全写法如下：

#include <stdio.h>
#include <stdlib.h>

int main(void) {
    printf("Content-Type: text/plain;charset=us-ascii\n\n");
    printf("Hello world\n\n");

    char* data = getenv("QUERY_STRING");
    if (!data || *data == '\0') {
        printf("Error: No query string received.\n");
        return 1;
    }

    char name[50];
    int port, id;
    char config[50];

    // 关键改进：用 %49[^&] 替代 %s，明确以 '&' 为截断点；%49s 同样加宽度限制
    int ret = sscanf(data, "Name=%49[^&]&Port=%d&ID=%d&Config=%49s", 
                     name, &port, &id, config);

    if (ret != 4) {
        printf("Parse error: expected 4 fields, got %d\n", ret);
        return 1;
    }

    printf("Name: %s\n", name);   // 输出 "ss"
    printf("Port: %d\n", port);   // 输出 "8081"
    printf("ID: %d\n", id);       // 输出 "0"
    printf("Config: %s\n", config); // 输出 "testconfig"
    return 0;
}

? 关键要点总结：

❌ 避免裸用 %s 解析无空白分隔的 URL 参数；
✅ 优先使用 %[^&]（或 %[^&=] 等）配合明确分隔符；
✅ 始终指定最大宽度（如 %49[^&]），杜绝缓冲区溢出风险；
✅ 检查 sscanf 返回值，确保所有预期字段成功解析（返回值应等于格式项数量）；
⚠️ 注意：sscanf 不解码 URL 编码（如 + → 空格、%20 → 空格），生产环境需额外实现 url_decode() 函数。

此方案兼顾安全性、可读性与 CGI 场景的实用性，是解析简单查询字符串的经典实践。

相关标签:

字符串 CGI

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：HTML5WebSocket消息丢包_HTML5重发机制与ack确认实现教程【指南】下一篇：HTML5FormData上传附带参数_HTML5multipartform-data拼接额外字段操作【指南】

作者最新文章

如何在 Go 中正确发送 HTTP POST 表单请求

2026-02-26 09:00

如何将 MySQL 查询结果正确输出为标准 JSON 格式

2026-02-26 09:13

百度农场登录入口在哪

2026-02-26 09:37

300大作战迪斯卓尔值得买吗迪斯卓尔角色详解

2026-02-26 09:40

Eloquent 的 createMany 是否保证插入顺序与输入数组一致？

2026-02-26 09:41

TCL登顶全球电视市场，松下调整战略聚焦高端与本土

2026-02-26 09:53

如何在 Go 中超时控制函数执行并精确测量耗时

2026-02-26 09:54

Log4j 中 stdout 与 fileout 的区别及配置最佳实践

2026-02-26 10:02

Phil Spencer 退休，Sarah Bond 离职，Matt Booty 晋升

2026-02-26 10:02

如何通过外部脚本动态启用或禁用 wrapt 装饰器

2026-02-26 10:16

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

638

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

218

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1560

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

643

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

1067

2024.03.22