php json中文乱码根本原因是输入非utf-8编码或响应头未声明charset=utf-8;需确保数据源、数据库、文件、post均为utf-8,json_encode前校验编码并检查返回值,输出前设置header('content-type: application/json; charset=utf-8')。

PHP 返回 JSON 数据出现中文乱码,根本原因几乎总是 json_encode() 输入的字符串本身不是 UTF-8 编码,或 HTTP 响应头未正确声明字符集。UTF-8 是 json_encode() 唯一接受的输入编码,其他编码(如 GBK、GB2312)会直接导致乱码或返回 null。
确认原始数据是否为 UTF-8 编码
很多乱码问题其实发生在 JSON 生成之前:数据库连接、文件读取、POST 数据接收等环节已引入非 UTF-8 字符。不能只盯着 json_encode()。
- MySQL 查询前执行
SET NAMES utf8mb4(推荐),或在 PDO 连接时指定charset=utf8mb4 - 读取本地文件(如 JSON 配置)时,用
file_get_contents()后检查:mb_detect_encoding($str, ['UTF-8', 'GBK', 'BIG5'], true);非 UTF-8 则用mb_convert_encoding($str, 'UTF-8', 'GBK')转换 - 接收前端 POST 数据时,确保 HTML 页面
<meta charset="UTF-8">,且表单提交未被浏览器强制转码(少见但存在)
正确使用 json_encode() 并捕获错误
json_encode() 对非 UTF-8 字符串静默失败——不报错,只返回 false 或空字符串。必须主动检查返回值,并启用错误报告。
- 始终检查返回结果:
$json = json_encode($data); if ($json === false) { error_log('JSON encode failed: ' . json_last_error_msg()); } - 必要时添加标志提升兼容性:
json_encode($data, JSON_UNESCAPED_UNICODE | JSON_INVALID_UTF8_SUBSTITUTE)(PHP 7.2+),其中JSON_INVALID_UTF8_SUBSTITUTE可将非法 UTF-8 字节替换为 ,避免整个编码失败 - 不要依赖
iconv()或mb_convert_encoding()在json_encode()后处理结果——JSON 已是字符串,再转码可能破坏结构
设置正确的 HTTP 响应头
即使 JSON 内容正确,缺少响应头也会让某些客户端(尤其是老版本 IE、部分安卓 WebView)误判编码。
立即学习“PHP免费学习笔记(深入)”;
- 务必在输出 JSON 前发送:
header('Content-Type: application/json; charset=utf-8'); - 避免在
header()前有任何输出(包括 BOM、空格、echo),否则报“headers already sent”错误 - 如果使用框架(如 Laravel、ThinkPHP),确认其 JSON 响应方法是否已自动设置该 header;若手动 echo,仍需自己补上
最隐蔽的问题往往出在数据源头——比如从 Excel 导入的 CSV 用 Excel 保存默认是 ANSI(Windows-1252),PHP 读出来就是乱码,json_encode() 无力回天。与其反复调试 JSON 输出,不如先用 bin2hex() 检查一个中文字符的字节序列,确认它是不是真正的 UTF-8(如“中”应为 e4b8ad)。











