字符串出现次数统计_PHP substr_count计数方法【技巧】

看不見的法師

发布时间：2026-03-15 14:11:38

503人浏览过

来源于php中文网

原创

substr_count 统计子串而非单字符，只进行字节级精确匹配，不支持正则、大小写忽略或重叠匹配；需注意编码一致性、参数类型及性能优化。

字符串出现次数统计_php substr_count计数方法【技巧】

substr_count 统计的是子串，不是字符

很多人用 substr_count 想统计某个字符（比如空格、逗号）出现几次，结果对不上——因为 substr_count 是按「子串」匹配的，它不拆解字符串，也不支持正则，更不会把 "a" 当作单字符去逐个扫描。它只找完全一致的连续片段。

想统计单个字符？没问题，substr_count($str, " ") 可以，但前提是你要确认那个“空格”确实是 ASCII 空格（"\x20"），而不是全角空格、"\t" 或 "\n"
想统计中文标点（如“，”）？可以，但注意 UTF-8 下它是 3 字节，substr_count 本身是字节安全的，只要编码统一就 OK
误传正则表达式（比如 "/\d+/"）会直接返回 0，因为它当字面量去匹配，根本不会解析正则

大小写敏感且不支持选项参数

substr_count 没有 flag 参数，不接受 PREG_OFFSET_CAPTURE 这类东西，也没有 IGNORE_CASE 开关。它就是硬匹配，大小写一个字母都不能差。

要忽略大小写？得先用 mb_strtolower() 或 strtolower() 统一转换（注意多字节安全：如果字符串含中文，优先用 mb_strtolower($str, "UTF-8")）
别试图在第三个参数 $offset 或第四个 $length 里塞布尔值或数组，它们只接受整数，传错类型 PHP 会静默转成 0 或 1，结果难排查
起始偏移量 $offset 超出字符串长度时，返回 0；$length 为负数会被截断为 0，不是从末尾倒数

性能高，但别在循环里反复调用

substr_count 是 C 实现的，比 preg_match_all 快得多，也比手写 for 循环遍历快。但它再快，也扛不住你在十万次循环里对同一长字符串反复调用。

常见反模式：foreach ($words as $w) { $cnt = substr_count($text, $w); ... } —— 应该预处理：先把所有关键词合并进一个正则（如果逻辑允许），或用 Aho-Corasick 算法（PHP 扩展如 ext-aho-corasick）
如果只是查固定几个词（比如 3–5 个），不如提前 str_replace 计数，或者用 array_count_values(array_filter(explode(...)))（仅限分隔明确场景）
注意内存：substr_count 不复制字符串，但如果你传入的是大文件 file_get_contents() 结果，它仍会在内存中完整加载并扫描

替代方案选型：什么时候不该用 substr_count

当你需要「位置信息」「重叠匹配」「模糊匹配」或「跨编码边界操作」时，substr_count 就到头了。

灵机语音

下载

立即学习“PHP免费学习笔记（深入）”；

要找重叠子串（如 "aaaa" 中 "aa" 出现几次？答案应是 3，但 substr_count 返回 2）→ 改用 preg_match_all('/(?=aa)/', $str)
要返回每个匹配的起始位置 → 用 mb_strpos 循环，或 preg_match_all('/pattern/', $str, $matches, PREG_OFFSET_CAPTURE)
字符串是 GBK 编码且含中文，又用了 mb_* 函数做预处理 → 确保 mb_internal_encoding("GBK") 已设，否则 mb_strtolower 可能截断乱码，导致 substr_count 匹配失败

最常被忽略的一点：substr_count 对 null、false、数字等非字符串类型会静默转成字符串再匹配。比如 substr_count(123, "2") 返回 1，但 substr_count([], "2") 返回 0（因为 (string)[] === ""）。传参前最好加 is_string() 判断，尤其数据来自 JSON 解析或 DB 查询时。

宝塔面板如何将网站的Session存储从文件切换到Redis？

PHP Fiber 并非多线程：异步邮件发送的正确实现方案

如何使用 PHP 表单调用计算器类执行四则运算

PHP 数组按指定起始元素循环重排序教程

PHP 中基于指定元素位置对二维数组进行循环轮转排序

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php json 正则表达式 String NULL for foreach 字符串循环 Length 字符串类型 ASCII 算法性能优化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Laravel 迁移中正确设计下拉列表与开关控件对应的数据字段下一篇：暂无

作者最新文章

2026 AWE双馆联动！LG 电子“以智结情”全景演绎 AI 智慧生活新图景

2026-03-13 14:20

Zoom怎么启用双显示器_Zoom演讲者视图分屏显示教程

2026-03-13 14:34

笔趣阁怎么开启小窗_笔趣阁视频悬浮窗播放设置

2026-03-13 14:40

ppt点击出现音乐怎么设置_ppt点击鼠标才播放音乐【技巧】

2026-03-13 14:56

QClaw怎么让AI帮我找文献并生成APA格式引用_QClaw学术研究技能【方法】

2026-03-13 15:00

抖音怎么删除自己的作品_抖音批量删除视频方法步骤

2026-03-13 15:24

模板继承和布局怎么使用_模板布局重用【方法】

2026-03-13 15:50

ChatGPT批量写工作总结怎么实现_高效提示方法是什么【介绍】

2026-03-13 16:02

OpenClaw多任务处理_OpenClaw多任务方法【操作】

2026-03-13 16:02

HTML文档结构如何实现语义化_提升可访问性的代码结构设计【方法】

2026-03-13 16:13

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23