C++怎么解决中文字符 C++中wstring和string转换【方案】

裘德小鎮的故事

发布时间：2026-03-12 01:55:11

890人浏览过

来源于php中文网

原创

最稳方案是用multibytetowidechar指定cp936代码页转换，避免依赖locale或控制台编码；std::wstring_convert已废弃且gcc未实现，std::wcout易因编码不匹配输出乱码。

c++怎么解决中文字符 c++中wstring和string转换【方案】

Windows下用`MultiByteToWideChar`转string到wstring最稳

直接调std::wstring_convert在VS2015之后就废弃了，GCC里压根没实现过，别碰。Windows平台默认编码是GBK（CP936），MultiByteToWideChar能明确指定代码页，不依赖locale设置，也不怕控制台乱码干扰。

常见错误现象：用std::wcout 输出空白或问号；<code>wstring内容看起来像乱码但长度对得上——大概率是UTF-8字节被当成了Latin-1解码。

先确认源string是GBK编码（比如从文件读、控制台输入、WinAPI返回）
调用MultiByteToWideChar(CP_ACP, 0, src.c_str(), -1, nullptr, 0)获取目标缓冲区大小
分配std::vector<wchar_t></wchar_t>，再调一次填入数据，最后构造std::wstring
如果源是UTF-8（比如网络JSON、Linux跨平台代码），把CP_ACP换成CP_UTF8

Linux/macOS下用`std::codecvt_utf8<wchar_t></wchar_t>`要小心locale

这个转换器只支持UTF-8 ↔ UTF-32（wchar_t在Linux是4字节），不能处理GBK/Big5。而且std::codecvt系列在C++17已被弃用，新项目尽量避免。

使用场景有限：你确定输入是UTF-8，且只在glibc环境跑，setlocale(LC_ALL, "")已正确设置（比如LANG=zh_CN.UTF-8）。

立即学习“C++免费学习笔记（深入）”；

拍我AI

AI视频生成平台PixVerse的国内版本

下载

别直接用std::wstring_convert<:codecvt_utf8>></:codecvt_utf8>——它内部依赖locale facet，而glibc的std::codecvt_byname对中文locale支持不稳定
更可靠的做法：用iconv()系统调用，显式指定"UTF-8"→"WCHAR_T"
如果只是临时调试，std::mbstowcs可应急，但它依赖当前C locale，setlocale(LC_CTYPE, "zh_CN.UTF-8")必须在转换前调用

`std::string`存中文时，别假设单字符=单字

UTF-8里一个汉字占3字节，str[0]取出来的是第一个字节，不是“第一个字”。str.length()返回字节数，不是字数。这是所有后续转换出错的根源。

容易踩的坑：for (int i = 0; i 会把汉字拆成3个乱码字节输出；用<code>s.substr(0, 2)可能切在汉字中间，导致后续解码失败。

需要按Unicode字符遍历时，用std::u8string（C++20）配合std::mbrtoc8，或第三方库如utf8cpp
简单场景下，先转成std::wstring再用wstr.size()和wstr[i]——这时才是真正的“第i个字符”
文件读写务必明确编码：用std::ifstream打开文本时加std::ios::binary，自己处理BOM和转换，别依赖流的自动编码推断

跨平台项目统一用UTF-8 + `std::string`，`wstring`只用于WinAPI交互

Windows控件（CreateWindowEx、SetWindowTextW）、COM接口、部分WinSDK函数强制要求LPCWSTR。除此之外，现代C++项目尽量让std::string承载UTF-8字节流，避免在各处反复转换。

性能影响明显：每次string↔wstring都要遍历、查表、分配内存；wstring在Linux占4倍空间（wchar_t=4B），Windows是2B（UCS-2子集），同一份代码行为不一致。

对外接口（网络、文件、CLI参数）全部用UTF-8 std::string
仅在调用WinAPI前一刻，用MultiByteToWideChar(CP_UTF8, ...)转一次；返回后立刻转回
CMake里加add_compile_options(-finput-charset=UTF-8 -fexec-charset=UTF-8)，避免源码中文字符串被编译器误判编码

事情说清了就结束。真正麻烦的从来不是怎么转，而是搞不清当前string到底是什么编码、从哪来、要到哪去。

C++如何利用std::call_once确保代码只运行一次？（线程安全）

C++中如何通过std::source_location自动化生成单元测试的追踪日志？（测试开发）

C++如何构建一个毫秒级延迟的定时器任务系统？（时间轮算法实现）

C++怎么用枚举类 C++11强类型枚举优点【前沿】

C++如何实现状态机？（switch与表驱动对比）

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1010

2023.08.02

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

1496

2023.07.26

查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口，端口占用问题是计算机系统编程领域的一个常见问题，端口占用的根本原因可能是操作系统的一些错误，服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1170

2023.07.27

windows照片无法显示

当我们尝试打开一张图片时，可能会出现一个错误提示，提示说"Windows照片查看器无法显示此图片，因为计算机上的可用内存不足"，本专题为大家提供windows照片无法显示相关的文章，帮助大家解决该问题。

835

2023.08.01

windows查看端口被占用的情况

windows查看端口被占用的情况的方法：1、使用Windows自带的资源监视器；2、使用命令提示符查看端口信息；3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容，供大家免费下载体验。

463

2023.08.02

windows无法访问共享电脑

在现代社会中，共享电脑是办公室和家庭的重要组成部分。然而，有时我们可能会遇到Windows无法访问共享电脑的问题。这个问题可能会导致数据无法共享，影响工作和生活的正常进行。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

2361

2023.08.08

windows自动更新

Windows操作系统的自动更新功能可以确保系统及时获取最新的补丁和安全更新，以提高系统的稳定性和安全性。然而，有时候我们可能希望暂时或永久地关闭Windows的自动更新功能。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

874

2023.08.10

windows boot manager

windows boot manager无法开机的解决方法：1、系统文件损坏，使用Windows安装光盘或USB启动盘进入恢复环境，选择修复计算机，然后选择自动修复；2、引导顺序错误，进入恢复环境，选择命令提示符，输入命令"bootrec /fixboot"和"bootrec /fixmbr"，然后重新启动计算机；3、硬件问题，使用硬盘检测工具进行扫描和修复；4、重装操作系统。本专题还提供其他解决

1976

2023.08.28

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板