c++如何将string转换为wstring_c++宽窄字符转换【源码】

冰火之心

发布时间：2026-01-24 13:18:02

510人浏览过

来源于php中文网

原创

应使用MultiByteToWideChar（Windows）或std::mbrtowc（跨平台），而非弃用的std::codecvt或locale依赖的mbstowcs；源字符串编码必须明确为UTF-8，不可依赖系统locale。

c++如何将string转换为wstring_c++宽窄字符转换【源码】

std::string 转 std::wstring 用 mbstowcs 还是 std::codecvt？

在 C++11 及以后，std::codecvt 已被弃用（C++17 标准中标记为 deprecated），且 MSVC 和 GCC 都不推荐继续使用。直接调用 mbstowcs 或 MultiByteToWideChar（Windows）更可靠、更可控。

关键点在于：源 std::string 的编码必须明确——它通常是 UTF-8（Linux/macOS 默认）、GBK（中文 Windows 系统本地代码页），或其它 locale-dependent 编码。不能假设“系统 locale 就是 UTF-8”。

Linux/macOS 下多数终端和文件 I/O 默认 UTF-8，mbstowcs 在 LC_CTYPE 设为 en_US.UTF-8 时可安全转换 UTF-8 到 wchar_t
Windows 控制台默认是 GBK（如 Chinese_PRC.936），此时若传入 UTF-8 字符串却用 mbstowcs，会乱码或截断
std::wstring_convert 同样已弃用，不要在新项目中使用

Windows 下用 MultiByteToWideChar 转 UTF-8 到 wstring

这是 Windows 上最稳妥的方式，尤其当你明确知道输入是 UTF-8（比如从 JSON、网络 API、UTF-8 文本文件读取的 std::string）。

示例（无异常处理简化版）：

立即学习“C++免费学习笔记（深入）”；

PixVerse

PixVerse是一款强大的AI视频生成工具，可以轻松地将多种输入转化为令人惊叹的视频。

下载

std::wstring string_to_wstring(const std::string& str) {
    if (str.empty()) return std::wstring();
    int len = MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, nullptr, 0);
    std::wstring result(len - 1, L'\0'); // -1 排除 null terminator
    MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, &result[0], len);
    return result;
}

CP_UTF8 明确指定输入为 UTF-8；别用 CP_ACP（当前 ANSI 代码页），它在中文 Windows 上是 GBK，和 UTF-8 混用必出错
两次调用：第一次获取所需缓冲区长度，第二次写入；避免硬分配过大 buffer 或栈溢出
返回值含末尾 L'\0'，但 std::wstring 自身不依赖它，所以 len - 1 是安全的字符数

跨平台（UTF-8 输入）用 std::mbrtowc 手动转换

如果不想引入 Windows API，又需兼容 Linux/macOS，可用 std::mbrtowc 逐字符解析 UTF-8 —— 它是 C 标准库函数，行为定义清晰，且不依赖全局 locale 设置（只要传入正确的 mbstate_t 初始化状态）。

注意：std::mbrtowc 不是“一次转整个字符串”，需循环调用：

std::wstring utf8_to_wstring(const std::string& u8str) {
    std::wstring result;
    result.reserve(u8str.size()); // 粗略预分配（UTF-8 中 ASCII 占 1 字节，汉字占 3，wchar_t 通常 4 字节）
    mbstate_t state = {};
    const char* ptr = u8str.c_str();
    const char* end = ptr + u8str.size();
    while (ptr < end) {
        wchar_t wc;
        size_t r = std::mbrtowc(&wc, ptr, end - ptr, &state);
        if (r == static_cast<size_t>(-1)) break; // 无效 UTF-8
        if (r == static_cast<size_t>(-2)) break; // 截断（不完整多字节序列）
        if (r > 0) {
            result.push_back(wc);
            ptr += r;
        } else {
            ptr++; // r == 0，遇到 '\0'
        }
    }
    return result;
}

必须初始化 mbstate_t state = {}，否则未定义行为
返回值 -1 表示非法字节序列（如 "\xFFabc"），-2 表示输入结束但多字节未完成（如只剩 "\xE4\xB8"）
该函数不修改 locale，因此比 mbstowcs 更可预测——前提是输入确实是 UTF-8

为什么不能直接 reinterpret_cast<const wchar_t*>(str.data())？

因为 std::string 和 std::wstring 的内存布局完全不同：前者是连续 char（1 字节），后者是连续 wchar_t（Windows 是 2 字节，Linux/macOS 通常是 4 字节）。直接 reinterpret_cast 会导致：

字节序错乱（如 UTF-8 的 "中" 是 \xE4\xB8\xAD，强制当 wchar_t 读成 0xE4B8 或 0x00E4B800，完全不是 U+4E2D）
越界访问（str.size() 字节 ≠ wstr.size() 个 wchar_t）
程序崩溃或静默数据损坏，尤其在开启 ASAN 或不同平台时表现不一

这种“捷径”只在极特殊场景（如你 100% 确定 string 是按 wchar_t 大小对齐的二进制 dump，且平台一致）下才可能成立，日常开发中等同于埋雷。

C++怎么使用std::chrono_C++高精度时间处理【技巧】

C++如何实现高精度的睡眠(Sleep)功能？（计时器限制）

如何在C++中捕获并处理异常崩溃？（健壮性设计）

如何在Linux系统下用命令行编译C++源文件？（入门必看）

c++怎么获取控制台输入的一个字符_c++中getch用法【基础】

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

linux js json windows 编码字节 mac 栈 c++ macos win cos 标准库 json String const 字符串 char wchar_t 循环栈 len windows macos linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C++ 怎么判断操作系统位数 C++ sizeof(void*)检测环境代码【兼容】下一篇：C++怎么求素数 C++判断质数的高效算法代码【练习】

作者最新文章

Boss直聘网页版登录地址 Boss直聘招聘官网入口进入

2026-03-13 17:06

转转app怎么实名认证账号转转app怎么提高账号信用分【经验】

2026-03-13 17:06

盘搜搜官网在线入口盘搜搜网页版官方平台

2026-03-13 17:07

linux怎么设置定时任务_linux配置crontab【实战】

2026-03-13 17:11

vivo浏览器书签栏怎么显示？vivo浏览器显示收藏夹【必看】

2026-03-13 17:17

win10怎么开启Windows沙盒隔离测试 win10启用安全虚拟机【硬核】

2026-03-13 17:20

转转如何查看物流单号转转订单快递查询步骤【必看】

2026-03-13 17:22

win11怎么关闭小组件带来的天气新闻 win11彻底隐藏左下角【清爽】

2026-03-13 17:24

composer运行卡在检查更新_禁用composer自更新检查功能【提示】

2026-03-13 17:25

vivo浏览器如何设置电脑版UA？vivo浏览器访问PC端网站【设置】

2026-03-13 17:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23

jquery怎么操作json

操作的方法有：1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”；3、“$.each(obj, callback)”；4、“$.ajax()”。更多jquery怎么操作json的详细内容，可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法

本专题整合了go语言中处理json数据方法，阅读专题下面的文章了解更多详细内容。

2025.09.10

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1051

2023.08.02

c语言const用法

const是关键字，可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍：1、声明常量，const关键字可用于声明常量，常量的值在程序运行期间不可修改，常量可以是基本数据类型，如整数、浮点数、字符等，也可是自定义的数据类型；2、函数参数中的const修饰符，const关键字可用于函数的参数中，表示该参数在函数内部不可修改等等。

564

2023.09.20