中文乱码需统一源文件编码、ide内部编码和终端编码:windows终端用chcp 65001,ide设utf-8,jvm加-dfile.encoding=utf-8,python需确保终端与文件均为utf-8无bom。

IDE默认编码不是UTF-8,Console输出中文变问号
IntelliJ IDEA、PyCharm等JetBrains系IDE在Windows上默认用GBK读写文件,但System.out.println()或print()往控制台输出UTF-8字符串时,若终端(如Windows Terminal或CMD)没同步设为UTF-8,就会显示或乱码。
关键不是改IDE设置,而是让「源文件编码」「IDE内部编码」「终端编码」三者对齐。优先检查终端:
- Windows CMD:运行
chcp 65001临时切到UTF-8(65001是UTF-8的代码页) - Windows Terminal:设置里把默认配置的
locale设为en-US.UTF-8,并确保font支持中文(如Cascadia Code PL) - macOS/Linux终端天然支持UTF-8,但需确认
LANG环境变量含UTF-8(如export LANG=en_US.UTF-8)
File Encoding设置里三个选项必须一致
IDE右下角状态栏点编码名(如GBK)可快速切换,但只改这里不够。要进Settings > Editor > File Encodings统一设:
-
Global Encoding:建议设为UTF-8(影响新建文件) -
Project Encoding:必须和Global Encoding相同,否则新模块可能继承旧值 -
Default encoding for properties files:Java的.properties文件默认ISO-8859-1,若含中文,这里得改成UTF-8,并加\uXXXX转义或启用Convert properties files to UTF-8选项
改完别忘了勾选Transparent native-to-ascii conversion——它让IDE自动把中文转成\u6211格式存盘,避免Git提交时编码冲突。
Java程序Console乱码:-Dfile.encoding参数不能少
即使IDE设了UTF-8,Java虚拟机启动时仍按系统默认编码读取字节流。Windows上JVM默认用GBK解码System.in和System.out,导致Scanner读中文失败、System.out.println("你好")输出乱码。
解决方式是在运行配置里加VM选项:
-Dfile.encoding=UTF-8
注意:-Dfile.encoding必须写在VM options框里,不是Program arguments;且它只对当前运行配置生效,Maven/Gradle构建需额外配argLine或jvmArgs。
验证是否生效:在代码里加System.out.println(System.getProperty("file.encoding"));,输出应为UTF-8。
Python脚本在IDE里跑正常,命令行报UnicodeEncodeError
这是典型“IDE替你扛了编码问题”。PyCharm默认用UTF-8运行Python,但Windows CMD的chcp还是GBK,导致print("中文")调用sys.stdout.write()时抛UnicodeEncodeError: 'gbk' codec can't encode character。
临时解法(开发阶段):
- 在Python脚本开头加
import io; import sys; sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8') - 或设环境变量
PYTHONIOENCODING=utf-8(比set PYTHONIOENCODING=utf-8更可靠)
长期建议:统一用Windows Terminal + chcp 65001,并确保Python文件本身以UTF-8无BOM保存(VS Code或Notepad++可设)。BOM头会让# -*- coding: utf-8 -*-失效,引发SyntaxError。
最常被忽略的是:Python 3.7+在Windows上已默认用UTF-8,但仅限于CP65001激活后——也就是说,不手动chcp 65001,sys.getdefaultencoding()仍是utf-8,但sys.stdout.encoding还是cp936(GBK)。这个细节卡住很多人。










