
PHP json_encode() 默认不支持 UTF-8 以外的编码,多语言文本会变乱码
PHP 的 json_encode() 要求输入字符串必须是 UTF-8 编码,否则直接返回 false 或输出空字符串。常见于从数据库读出 GBK/GBK2312 编码的中文、或读取本地 ini 文件时没转码。
- 用
mb_detect_encoding()检查原始字符串编码,别凭感觉假设是 UTF-8 - 强制转码再编码:
json_encode(mb_convert_encoding($text, 'UTF-8', 'AUTO')) - 如果数据来自 MySQL,优先在连接层设好编码:
$pdo->exec("SET NAMES utf8mb4"),比 PHP 层补救更可靠 - 注意
mb_convert_encoding()的第三个参数如果是'AUTO',对某些混合编码可能误判,明确写'GBK,GB2312,UTF-8'更稳妥
PHP 多语言 JSON 结构怎么设计才方便前端切换语言
别把所有语言文本平铺在顶层键里(比如 {"zh": "你好", "en": "Hello", "ja": "こんにちは"}),这种结构会让前端每次都要重复判断当前语言并取值,耦合高、难维护。
- 推荐按“资源 ID + 语言映射”组织:
{"greeting": {"zh": "你好", "en": "Hello", "ja": "こんにちは"}} - 后端只输出当前请求语言的完整翻译包(如
GET /i18n?lang=ja→ 返回所有ja值),减少前端逻辑 - 避免在 JSON 中嵌套 HTML 或富文本——特殊字符(如
、<code>")容易引发转义混乱;统一由前端渲染时做安全处理 - 如果用 Twig/Blade 等模板引擎生成 JSON,注意关闭自动转义,否则
{{ trans('welcome') | json_encode }}可能多一层引号
json_encode() 处理含中文键名的数组会失败?其实是 key 必须是字符串
PHP 数组 key 是整数或字符串,但 JSON 对象 key 只能是字符串。如果用中文当 key 且没加引号(比如 ['你好' => 'world']),其实没问题;但如果 key 是变量或表达式结果,就容易出错。
- 确认 key 类型:
var_dump(array_keys($arr)),看到int(0)就说明 key 被当成数字了(比如['你好' => ...]写成[你好 => ...],PHP 会尝试常量查找,找不到就当 0) - 动态生成 key 时,显式强转:
$data[(string)$lang] = $text - 用
JSON_UNESCAPED_UNICODE标志防止中文被编码成\u4f60\u597d:json_encode($data, JSON_UNESCAPED_UNICODE) - 该标志在 PHP 5.4+ 才支持,老环境得靠
preg_replace_callback()手动还原,不建议硬扛
PHP 输出 JSON 前漏了 header('Content-Type: application/json; charset=utf-8')
没设 header 不影响 json_encode() 执行,但浏览器或前端框架(如 Axios)可能按默认 text/html 解析响应,导致解析失败或乱码,错误信息常是 SyntaxError: Unexpected token (实际返回了 HTML 错误页)。
立即学习“PHP免费学习笔记(深入)”;
- 必须在
echo json_encode(...)前调用:header('Content-Type: application/json; charset=utf-8') - 如果用了输出缓冲(
ob_start()),确保没其他内容提前输出(包括 BOM、空格、警告),否则 header 会失效 - 调试时用
curl -I或浏览器 DevTools 的 Network → Response Headers 确认 header 是否生效 - 某些 Nginx 配置会强制覆盖 header,检查是否有
add_header Content-Type ...指令干扰
json_encode() 解决,得结合 Accept-Language 解析、缓存策略和前端协商机制来兜底。










