php判断字符串长度含零宽字符_php零宽字符处理法【步骤】

雪夜

发布时间：2026-01-29 09:06:39

844人浏览过

来源于php中文网

原创

strlen() 按字节计数，零宽字符（如 U+200B）在 UTF-8 中占 3 字节，故返回 3，但语义长度应为 0；应改用 mb_strlen($str, 'UTF-8') 并配合正则清除零宽字符后校验。

php判断字符串长度含零宽字符_php零宽字符处理法【步骤】

PHP 中 `strlen()` 为什么算不准含零宽字符的字符串长度

strlen() 按字节计数，而零宽字符（如 \u200b、\u200c、\u200d、\ufeff）在 UTF-8 编码下占多个字节（通常是 3 字节），但语义上“不可见、不占位”。所以一个看似空的字符串 "\xe2\x80\x8b"（U+200B 的 UTF-8 编码）用 strlen() 返回 3，而人眼和业务逻辑通常认为它“长度为 0”或“应被忽略”。

真正需要的是按 Unicode 码点（grapheme）或视觉宽度判断，而非原始字节。

用 `mb_strlen()` 替代 `strlen()` 时要注意编码参数

mb_strlen() 默认使用 mb_internal_encoding()，若未显式设为 'UTF-8'，可能因环境差异返回错误结果。尤其在 CLI 模式或某些旧 PHP 配置下，内部编码可能是 ISO-8859-1，导致零宽字符被截断或误判。

务必显式传入 'UTF-8' 第二个参数：mb_strlen($str, 'UTF-8')
避免依赖 mb_internal_encoding() 的全局设置，它容易被其他库修改
注意：即使用了 mb_strlen()，U+200B、U+200C 等仍会计为 1 个码点——这符合 Unicode 标准，但业务上你可能想过滤掉它们

检测并剥离常见零宽字符的实用正则写法

零宽字符不是“空白”，trim() 和 ctype_space() 完全无效。必须用 Unicode 属性或具体码点匹配。

Bandy AI

全球领先的电商设计Agent

下载

立即学习“PHP免费学习笔记（深入）”；

最简方案（覆盖主流零宽控制符）：preg_replace('/[\x{200b}-\x{200f}\x{202a}-\x{202e}\x{feff}]/u', '', $str)
更严格（仅零宽连接/分隔类）：preg_replace('/[\x{200b}\x{200c}\x{200d}\x{2060}\x{feff}]/u', '', $str)
替换后建议再用 mb_strlen($cleaned, 'UTF-8') 判断有效长度
注意 /u 修饰符必不可少，否则 UTF-8 多字节序列会被当乱码处理

用户输入场景下建议的完整校验流程

比如表单昵称、评论内容等需防零宽注入的字段，不能只靠长度判断，得组合清洗与语义检查。

先用 mb_convert_encoding($input, 'UTF-8', 'UTF-8') 归一化编码（修复损坏的 UTF-8 序列）
用上述正则清除零宽控制符
用 mb_ereg_replace('^\\s+|\\s+$', '', $cleaned) 或 trim() 去首尾空白（注意：零宽字符不在 \s 范围内）
最后用 mb_strlen($final, 'UTF-8') === 0 判空，或 >= 2 判最小有效长度
若需保留排版类零宽（如某些阿拉伯语连字控制符），则要白名单过滤，而非通杀

零宽字符本身合法且必要，问题出在滥用；关键不是“删光”，而是“识别意图”——用户真想提交一个纯零宽字符串？那大概率是测试或攻击。

php二维转一维用array_filter好吗_phparray_filter二维降维【方法】

php实时输出pdo查询实时返_php实时输出pdo流式法【技巧】

php创建文件追加模式怎样用_php追加写入创文件法【实例】

php怎样获取本机ip排除docker网桥_php过滤网桥ip教程【技巧】

php怎么判断变量为可调用类型_php可调用检测技巧【示例】

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php 编码字节为什么 strlen 字符串 input

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：php连接数据库长连接咋配置_php数据库长连接实现法【步骤】下一篇：php微信小程序数据缓存怎么弄_php配合缓存提升性能【技巧】

作者最新文章

作业帮如何绑定家长手机号_作业帮家长版关联孩子账号【方法】

2026-01-29 09:21

php怎么处理大数据量绘图表_php分页查数据绘散点图【技巧】

2026-01-29 09:25

TikTok海外版如何筛选优质博主合作_TikTok海外版筛选博主合作标准【甄选】

2026-01-29 09:25

php实现班级通信录怎么导入断点续传_php续传未导入数据【步骤】

2026-01-29 09:26

一公斤等于多少斤_一公斤等于两斤换算原理【常识】

2026-01-29 09:27

pocky小游戏能否邀请好友组队_pocky小游戏组队邀请与协作玩法【方法】

2026-01-29 09:30

html5可视化编辑能转成小程序吗_html5可视化转小程序法【教程】

2026-01-29 09:31

php获取本机ip在thinkphp中差异_thinkphp取ip教程【步骤】

2026-01-29 09:39

返乡拼车怎样确认司机靠谱滴滴/哈啰顺风车安全验证技巧【省心版】

2026-01-29 09:42

2026年少儿美术班怎么选不踩坑_少儿美术班选择要点【攻略】

2026-01-29 09:51

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

298

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

212

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1501

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

624

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

633

2024.03.22

php中定义字符串的方式

php中定义字符串的方式：单引号；双引号；heredoc语法等等。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

588

2024.04.29

go语言字符串相关教程

本专题整合了go语言字符串相关教程，阅读专题下面的文章了解更多详细内容。

171

2025.07.29

c++字符串相关教程

本专题整合了c++字符串相关教程，阅读专题下面的文章了解更多详细内容。

2025.08.07

Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用，包括对称加密与非对称加密（AES、RSA）、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范（如SQL注入、XSS、CSRF）及其防护措施。通过实战案例，帮助学习者掌握如何使用 Go 语言保障网络通信的安全性，保护用户数据与隐私。

2026.01.29

热门下载

网站特效

网站源码

网站素材

前端模板