0

0

php判断字符串长度按单词数算_php单词数替代长度法【要点】

蓮花仙者

蓮花仙者

发布时间:2026-01-25 18:49:16

|

969人浏览过

|

来源于php中文网

原创

str_word_count()用于统计英文单词数,返回整数表示单词总数,支持数组模式和自定义字母字符;对中文无效,需结合trim()、正则清理及字数统计。

php判断字符串长度按单词数算_php单词数替代长度法【要点】

PHP 用 str_word_count() 统计单词数而非字节

PHP 默认的 strlen()mb_strlen() 算的是字节或字符长度,不是“单词数”。要按英文单词个数判断字符串长度(比如限制用户输入最多 10 个单词),必须用 str_word_count()

它默认以空白、标点(如 .,!)为分隔符,只提取字母数字组合的“词”,忽略纯符号和空格:

echo str_word_count("Hello, world! How are you?"); // 输出:5
  • 返回整数:单词总数(最常用模式)
  • 支持第二个参数:0(返回数量)、1(返回单词数组)、2(返回 [位置 => 单词] 关联数组)
  • 第三个参数可指定额外“视为字母”的字符,比如支持带连字符的词:str_word_count("e-mail well-known", 0, '-')

中文字符串不能直接用 str_word_count()

str_word_count() 是为拉丁语系设计的,对中文、日文等无空格分词的语言完全无效——它会把整个中文字符串当作 0 个单词(因为没找到符合“字母+数字”规则的单元):

var_dump(str_word_count("你好世界")); // int(0)

如果业务场景混有中英文(如用户昵称“Tom_小明”),需先用正则或 preg_match_all() 提取英文单词再计数,中文部分建议改用字数(mb_strlen($s, 'UTF-8'))或自定义分词逻辑(如调用第三方 SDK),不要强行套用单词数逻辑。

立即学习PHP免费学习笔记(深入)”;

Rose.ai
Rose.ai

一个云数据平台,帮助用户发现、可视化数据

下载

验证输入时别漏掉 trim() 和非打印字符

用户粘贴内容常带首尾空格、制表符甚至零宽空格(\u200b),这些会导致 str_word_count() 返回异常结果(比如空字符串返回 0,但带空格的字符串可能返回 0 或 1,取决于空格位置):

  • 始终先 trim() 再统计:str_word_count(trim($input))
  • 警惕不可见字符:用 preg_replace('/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F]/', '', $input) 清理控制字符
  • 避免用 empty() 判断单词数是否为 0 —— 它无法区分“纯空格”和“真无词”,应显式比较:str_word_count(trim($input)) === 0

性能注意:大文本下 str_word_count()explode(' ', ...) 更可靠但稍慢

有人想用 count(explode(' ', $s)) 快速替代,但这是错的:它按空格硬切,无法处理多个空格、换行、标点后无空格等情况(例如 "a,b c" 会被算成 2 词,实际应为 3)。

str_word_count() 内部是状态机扫描,准确但比简单 explode 多 20%–30% 开销。对单次请求影响微乎其微;若需高频处理万级单词文本(如日志分析),可考虑缓存结果或改用 mb_split() 配合正则,但绝大多数表单校验场景无需优化。

真正容易被忽略的是:它不处理 Unicode 标点的边界情况(比如某些 emoji 后紧跟字母可能被误吞),生产环境若涉及国际化输入,建议加一层白名单校验或降级为字符长度兜底。

相关文章

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

203

2023.11.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1567

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

650

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1228

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1204

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

193

2025.07.29

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.4万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号