使用UTF-8编码和宽字符流(wofstream/wifstream)可可靠处理C++中文文件读写,需设置locale并注意跨平台兼容性及编译器对codecvt的支持差异。

在C++中处理中文字符的文件读写,关键在于正确设置编码格式和使用宽字符流。Windows系统默认使用GBK/GB2312编码,而Linux和macOS通常使用UTF-8。为了让中文字符正确写入和读取,推荐统一使用UTF-8编码,并配合宽字符(wchar_t)进行操作。
为了安全地处理中文,应使用宽字符流类 wofstream 和 wifstream,并确保文件以UTF-8编码保存。
示例代码:
#include <iostream>
#include <fstream>
#include <locale>
#include <codecvt>
int main() {
// 设置本地化环境,支持中文
std::locale::global(std::locale(""));
// 使用UTF-8宽字符转换
std::wofstream outFile("data.txt");
outFile.imbue(std::locale(std::locale(), new std::codecvt_utf8<wchar_t>));
if (outFile.is_open()) {
outFile << L"你好,世界!" << std::endl;
outFile << L"这是一段中文测试。" << std::endl;
outFile.close();
}
std::wifstream inFile("data.txt");
inFile.imbue(std::locale(std::locale(), new std::codecvt_utf8<wchar_t>));
if (inFile.is_open()) {
std::wstring line;
while (std::getline(inFile, line)) {
std::wcout << line << std::endl;
}
inFile.close();
}
return 0;
}
实际使用中需注意以下几点,避免中文乱码或读取失败:
立即学习“C++免费学习笔记(深入)”;
C编写,实现字符串摘要、文件摘要两个功能。里面主要包含3个文件: Md5.cpp、Md5.h、Main.cpp。其中Md5.cpp是算法的代码,里的代码大多是从 rfc-1321 里copy过来的;Main.cpp是主程序。
0
如果不使用宽字符,也可以直接以UTF-8编码写入普通字符串(char),但需确保源码保存为UTF-8且无BOM。
#include <iostream>
#include <fstream>
int main() {
std::ofstream out("data_utf8.txt");
if (out.is_open()) {
out << "你好,C++!" << std::endl;
out.close();
}
std::ifstream in("data_utf8.txt");
if (in.is_open()) {
std::string line;
while (std::getline(in, line)) {
std::cout << line << std::endl;
}
in.close();
}
return 0;
}
此方法简单,但依赖编辑器保存为UTF-8,且无法用wcout处理,适合只写不处理的场景。
基本上就这些。关键是统一编码,优先用宽字符流配合locale和codecvt,能更可靠地读写中文。不同平台注意编译和运行环境设置,避免乱码。不复杂但容易忽略细节。
以上就是C++文件写入和读取中文字符的方法的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号