php判断字符串长度含越南文_php越南文特殊字符处理【步骤】

星夢妙者

发布时间：2026-02-19 13:48:02

345人浏览过

来源于php中文网

原创

php处理越南文需全程utf-8一致：strlen()应换mb_strlen()，preg_match()加/u并用\p{l}，mb_substr()须指定'utf-8'编码，html与表单需声明utf-8，数据库连接要设charset=utf8mb4。

php判断字符串长度含越南文_php越南文特殊字符处理【步骤】

strlen() 在越南文字符串上会返回错误长度

PHP 的 strlen() 按字节计数，而越南文含大量 UTF-8 多字节字符（如 đ、ơ、ư），一个字符可能占 2–3 字节。直接用 strlen() 判定“字符个数”必然出错。

例如："đủ" 实际是 4 字节（đ=2字节，ủ=2字节），但只有 2 个字符——strlen("đủ") 返回 4，而非预期的 2。

必须改用 mb_strlen($str, 'UTF-8') 获取真实字符数
确保脚本文件本身保存为 UTF-8 无 BOM 格式
若从数据库读取，确认连接层已设 UTF-8（如 PDO DSN 加 ;charset=utf8mb4）

preg_match() 匹配越南文时正则失效

默认 PCRE 不支持 Unicode 属性，/^[a-zàáạảãâầấậẩẫăằắặẳẵđèéẹẻẽêềếệểễìíịỉĩòóọỏõôồốộổỗơờớợởỡùúụủũưừứựửữỳýỵỷỹ\s]+$/i 这类手动列字符的方式极易漏写、难维护，且大小写不敏感标志 i 对越南文无效。

正确做法是启用 Unicode 模式并使用 \p{L}：

超会AI

AI驱动的爆款内容制造机

下载

立即学习“PHP免费学习笔记（深入）”；

if (!preg_match('/^\p{L}+$/u', $str)) {
    // 非纯越南文/拉丁字母字符
}

/u 修饰符强制 PCRE 以 UTF-8 解析模式和字符串
\p{L} 匹配任意 Unicode 字母（含越南文所有带调号字母）
避免手写字符集——đ 和 Đ 是两个独立码点，mb_strtoupper() 才能正确转换大小写

mb_substr() 截断越南文时出现乱码

用 substr() 截取越南文字符串，极易在多字节字符中间切断，导致后续输出显示或乱码。比如 substr("tối", 0, 3) 可能切掉 ối 的第一个字节，留下残缺字节序列。

一律改用 mb_substr($str, $start, $length, 'UTF-8')
第 4 个参数不可省略，否则依赖默认内部编码（可能不是 UTF-8）
注意：$length 单位是字符数，不是字节数
若需兼容 PHP 7.4 以下版本，检查 mb_internal_encoding() 是否已设为 'UTF-8'

表单提交或 URL 参数中的越南文变问号或方块

这不是 PHP 层问题，而是 HTTP 层未声明字符集。浏览器按 ISO-8859-1 解析表单，导致越南文字节被错误解释。

HTML 页面中必须有：<meta charset="UTF-8">
表单显式声明：<form accept-charset="UTF-8"></form>
PHP 接收后，用 mb_convert_encoding($_POST['text'], 'UTF-8', 'auto') 做兜底（仅限无法控制前端时）
Apache 配置中避免 AddDefaultCharset 覆盖为非 UTF-8

越南文处理的复杂点不在函数调用本身，而在整个链路的编码一致性——从编辑器保存、HTML 声明、HTTP 头、数据库连接到 PHP 内部函数，任一环节掉链子，都会让 mb_* 函数前功尽弃。

PHP用curl_setopt禁用重定向行吗_PHP禁重定向法【控制】

如何安全插入数据并避免重复：MySQL中基于唯一键的INSERT防重策略

PHP怎么运行命令行_PHP命令行模式使用教程【详解】

如何在 MySQL 中安全插入数据并避免重复的 ANr 值

PHP怎么实现分页功能_PHP分页查询代码编写指南【教程】

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php strlen pdo auto 字符串 Length bom 数据库 apache http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Laravel Nova 中为同一关联模型定义多个外键关系下一篇：如何在 PHP 中高效提取对象数组中指定键的值并转为一维数组

作者最新文章

Windows蓝屏代码irql怎么解决_Windows蓝屏常见代码排查【汇总】

2026-02-16 16:58

FeiKua浏览器下载文件很慢怎么办_FeiKua浏览器下载提速设置【方法】

2026-02-16 17:05

FeiKua浏览器怎么翻译网页_FeiKua浏览器自带翻译使用教程【教程】

2026-02-16 17:09

TT浏览器插件怎么管理_TT扩展程序安装禁用删除指南【教程】

2026-02-16 17:24

Windows系统蓝屏代码0x0000000f怎么解决_Windows蓝屏故障排查指南【解答】

2026-02-16 17:32

必应搜索怎么搜指定网站_Bing限定站点搜索语法使用【方法】

2026-02-16 17:34

豆包AI怎么生成治愈系晚安文案_豆包AI撰写高互动睡前语录

2026-02-16 17:38

Win10网络连接不上怎么办_netsh命令重置网络设置【解答】

2026-02-16 17:58

点点AI怎么生成小红书爆款标题_点点AI写高点击率标题详细教程

2026-02-16 18:24

Runway怎么剪视频_RunwayAI视频编辑快速上手教程

2026-02-16 18:39

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

php连接mssql数据库的方法

php连接mssql数据库的方法有使用PHP的MSSQL扩展、使用PDO等。想了解更多php连接mssql数据库相关内容，可以阅读本专题下面的文章。

1638

2023.10.23

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

573

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

216

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1553

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

640

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

945

2024.03.22