MySQL默认字符集是utf8mb3而非utf8mb4,需手动配置my.cnf/my.ini的client[mysqld]段落,设default-character-set和character-set-server为utf8mb4,并重启服务;再对已有库表字段执行ALTER转换;客户端连接也须显式指定utf8mb4。

MySQL 默认字符集不是 utf8mb4,要支持完整 Unicode(比如 emoji、生僻汉字),必须手动配置为 utf8mb4,并确保 collation 使用 utf8mb4_unicode_ci 或 utf8mb4_0900_ai_ci(MySQL 8.0+ 推荐)。
修改 MySQL 配置文件(my.cnf 或 my.ini)
这是全局生效的关键步骤。找到 MySQL 的配置文件(Linux 通常在 /etc/my.cnf 或 /etc/mysql/my.cnf,Windows 在 MySQL 安装目录下的 my.ini),在对应段落下添加或修改以下内容:
-
[client] 下添加:
default-character-set = utf8mb4 -
[mysql] 下添加:
default-character-set = utf8mb4 -
[mysqld] 下添加:
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci(或 utf8mb4_0900_ai_ci)
⚠️ 注意:不要只写 utf8 —— MySQL 的 utf8 实际是 utf8mb3,最多只支持 3 字节字符,无法存储 emoji 等 4 字节 Unicode 字符。
重启 MySQL 服务并验证配置
保存配置后,必须重启 MySQL 才能生效:
- Linux:
sudo systemctl restart mysql或sudo service mysqld restart - Windows:通过服务管理器重启 “MySQL” 服务
登录 MySQL 后执行以下命令确认是否生效:
SHOW VARIABLES LIKE 'character_set%';
SHOW VARIABLES LIKE 'collation%';
重点检查:
character_set_server、collation_server、character_set_database 应全为 utf8mb4 和对应 collation。
对已有数据库、表和字段单独转换
配置文件修改只影响新建库/表。已有对象需显式转换:
- 修改数据库默认字符集:
ALTER DATABASE db_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci; - 修改某张表:
ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; - 仅修改某个字段(如 TEXT 类型字段):
ALTER TABLE table_name MODIFY column_name VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
? 提示:执行前建议备份;若字段含索引且长度超限制(如 VARCHAR(255) + utf8mb4 可能超 InnoDB 行限制),可适当减小长度或改用 TEXT。
客户端连接时也需指定 utf8mb4
即使服务端设好了,应用连接时未声明字符集,仍可能乱码。常见做法:
- MySQL 命令行连接加参数:
mysql -u user -p --default-character-set=utf8mb4 db_name - PHP PDO 连接 DSN 中添加:
charset=utf8mb4(如mysql:host=localhost;dbname=test;charset=utf8mb4) - Java JDBC URL 添加:
?characterEncoding=utf8mb4&serverTimezone=UTC - Python PyMySQL / MySQLdb:在
connect()参数中指定 charset='utf8mb4'
不设置连接层字符集,即便表是 utf8mb4,插入/查询也可能退化为 latin1 或 utf8mb3 行为。










