必须用mb_strlen($str, 'utf-8')判断字符串长度,因strlen()返回字节数而非字符数,而mysql varchar(255)限制的是字符数;需确保php、连接、表字段全为utf8mb4编码,并显式指定编码参数。

PHP用strlen()还是mb_strlen()判断字符串长度
中文、emoji、全角符号等多字节字符下,strlen()会返回字节数而非字符数,而MySQL的VARCHAR(255)限制的是字符数(utf8mb4编码下最多255个字符),不是字节数。直接用strlen()校验会导致入库失败或截断。
必须用mb_strlen($str, 'UTF-8'),且确保PHP文件、数据库连接、表字段都统一为utf8mb4编码。
- 若未指定
mb_strlen的第二参数,依赖mb_internal_encoding(),易出错,务必显式传'UTF-8' - emoji(如?)占4字节,但算1个字符;全角中文同理——
mb_strlen才反映真实“字符长度” -
mb_strlen在PHP中默认可能未启用,检查phpinfo()中mbstring扩展是否加载
MySQL字段长度与PHP校验必须对齐编码和类型
常见错误:PHP用mb_strlen($s, 'UTF-8')判为255,但MySQL报Data too long for column。原因往往是字段定义没用utf8mb4,比如建表时写的是CHARSET=utf8(实际是utf8mb3,不支持4字节字符)。
- 字段定义必须含
CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci - PDO连接需设置
PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8mb4" - 确认
SHOW VARIABLES LIKE 'character_set%'中character_set_client、connection、results均为utf8mb4
入库前校验要覆盖NULL、空白、超长三种边界
只检查mb_strlen > 255不够。空格填充、全角空格 、零宽空格\u200b、NULL值都可能导致意外截断或约束失败。
立即学习“PHP免费学习笔记(深入)”;
- 先用
is_null()或=== null判断是否允许NULL;若字段为NOT NULL,需提前处理 - 用
trim($str)去首尾空白,再用mb_ereg_replace('\s+', '', $str)或正则清理不可见空白(可选) - 校验后建议用
mb_substr($str, 0, 255, 'UTF-8')安全截断,而不是依赖MySQL的自动截断(会触发warning且行为不可控)
ORM或框架中容易忽略的隐式截断点
Laravel Eloquent、ThinkPHP Model等常在save()或create()时静默截断超长字段,不抛异常。这种“成功入库但数据丢失”的问题最难排查。
- 开启MySQL严格模式:
sql_mode=STRICT_TRANS_TABLES,STRICT_ALL_TABLES,让超长直接报错而非截断 - 在Model的
saving事件里手动加mb_strlen校验,比依赖数据库更早发现问题 - 注意Laravel的
$fillable数组不会阻止超长,casts也不影响字符串长度,校验必须显式写
mb_strlen、SHOW CREATE TABLE、SELECT LENGTH(col), CHAR_LENGTH(col)交叉验证。











