array_filter()配合preg_match()是PHP正则筛选数组的标准解法,需用匿名函数封装preg_match()并注意字符串类型判断、修饰符使用及用户输入转义。

用 array_filter() 配合 preg_match() 最直接
PHP 没有内置「正则筛选数组」的函数,但 array_filter() 是标准解法。它逐个传入元素给回调函数,返回布尔值决定是否保留——这正好契合正则匹配逻辑。
常见错误是直接把正则写进 array_filter() 第二个参数,比如 array_filter($arr, '/^a/') ,这会报 Warning: array_filter() expects parameter 2 to be a valid callback,因为正则字符串不是可调用函数。
- 必须用匿名函数或命名函数封装
preg_match() - 注意
preg_match()第一个参数是 pattern(带分隔符,如/^abc/),第二个是待匹配字符串 - 数组元素是数字还是字符串?如果元素是数组或对象,
preg_match()会警告「Parameter must be a string」,需提前is_string()判断
示例:
$arr = ['apple', 'banana', 'cherry', 'avocado'];
$result = array_filter($arr, function($item) {
return preg_match('/^a/', $item);
});
// 返回 ['apple', 'avocado'](保留键名)
想忽略大小写或全局匹配?改 preg_match() 的 flag 就行
正则行为由修饰符控制,不是靠改数组或函数名。比如要不区分大小写匹配开头的 a,用 /^a/i;要匹配整个字符串(而非子串),用 /^a$/ 或更稳妥的 /^a\z/。
立即学习“PHP免费学习笔记(深入)”;
容易踩的坑是混淆 preg_match() 和 preg_match_all():前者只要找到一次就返回 1,后者才返回全部匹配项——筛选场景几乎只用 preg_match()。
-
/i:忽略大小写(/^A/i匹配'Apple') -
/m:多行模式(影响^和$,一般文本单行不用) -
/u:UTF-8 模式(处理中文、emoji 必加,否则preg_match('/^\w+$/u', '你好')可能失败)
性能敏感时,避免在回调里重复编译正则
每次 preg_match() 调用都会解析正则字符串。如果数组很大(上万项)且 pattern 固定,可以用 preg_match() 的第三个参数接收编译缓存(PHP 7.4+ 自动优化,但旧版仍建议显式复用)。
更实际的做法是把 pattern 提到闭包外,或用 use 传入,避免闭包内硬编码导致 opcache 无法复用:
$pattern = '/^[a-z]{3,}$/i';
$result = array_filter($arr, function($item) use ($pattern) {
return is_string($item) && preg_match($pattern, $item);
});
如果 pattern 来自用户输入,务必用 preg_quote() 转义,否则可能引发 PREG_BAD_UTF8_OFFSET_ERROR 或注入风险。
需要同时获取键名和值?别忘了 array_filter() 默认保留原始键
很多人以为筛选后键会重排,其实不会:array_values() 才会重置索引。如果你要保持顺序但需要数字键,得手动处理:
$result = array_values(array_filter($arr, $callback));
另一个易错点:空字符串 ''、null、0 在弱类型判断下会被当成 false,但 array_filter() 默认用 empty() 逻辑过滤——所以如果回调返回 0(比如 preg_match() 失败返回 0),它会被当作 false 过滤掉,这是正确行为;但若你误写了 return (int)preg_match(...),反而可能因类型转换出问题。
真正复杂的地方在于嵌套结构:如果数组元素是关联数组,而你想按某个字段正则筛选,就得先确保字段存在、是字符串,再匹配——这时候一行 array_filter() 很快变得不可读,该拆成独立函数了。











