应使用正则/^1[3-9]\d{9}$/校验手机号,始终以字符串处理、trim()去空格、清理不可见字符,用PhpSpreadsheet读取Excel,PHP层预检重复并分批查库。

导入前用 preg_match 做基础格式过滤
直接读取 Excel 或 CSV 后逐行校验手机号,别等全部入库再报错。国内手机号目前以 13x、14x、15x、17x、18x、19x 开头,长度固定 11 位,且第二位不能是 0 或 1(如 130~139、150~159 等有效,1300 这种超长或 1234567890 这种非号段都应拦截)。
推荐正则:/^1[3-9]\d{9}$/ —— 覆盖当前主流号段,比 /^1\d{10}$/ 更精准,能提前筛掉已停用或未分配的号段(如 144、147 中部分号段实际归属物联网卡)。
常见疏漏:
- 没
trim()去首尾空格,导致" 13812345678"匹配失败 - Excel 导出时把数字转成科学计数法(如
1.3812345678E+10),需强制转字符串再校验 - 单元格含换行符或不可见 Unicode 字符(如
\u200b),建议用preg_replace('/[\s\p{C}]+/u', '', $phone)清理
批量导入时用 filter_var($phone, FILTER_VALIDATE_INT) 不靠谱
FILTER_VALIDATE_INT 是用来验整数的,不是验手机号。11 位数字超出 PHP 32 位整型上限(约 21 亿),在某些环境会自动转成浮点或截断,13812345678 可能变成 13812345678.0 或科学计数,校验直接失败。
立即学习“PHP免费学习笔记(深入)”;
正确做法始终当字符串处理:
- 从
fgetcsv()或PhpSpreadsheet读出后,立刻(string)$cellValue - 避免用
intval()、settype($phone, 'int')转类型 - 数据库字段用
VARCHAR(11)存,别用INT或BIGINT—— 手机号本质是标识符,不是数值
去重和冲突检测得在 PHP 层做,别全丢给 MySQL UNIQUE
导入班级通信录常遇到“同班两人填了同一个号码”或“该号码已在其他班级存在”。如果只靠数据库 UNIQUE(phone) 报错,用户看到的是 SQL 异常,没法定位到第几行、谁和谁重复。
建议流程:
- 先用
array_unique()对当前批次去重(注意:要array_map('trim', $phones)后再去重) - 查库预检:构造
WHERE phone IN (".implode(',', array_map(fn($p) => "'$p'", $cleanPhones))."),取出已存在的号码及对应学生姓名/班级 - 生成结构化错误提示,例如:“第 7 行张三,手机号 139xxxx1234 已存在于高二(3)班李四名下”
注意:IN 子句别一次性塞几千个值,分批查(如每 500 个一批),否则 MySQL 可能报 max_allowed_packet 错误。
file_get_contents 读 Excel 容易乱码,优先用 PhpSpreadsheet
用 file_get_contents + 正则硬解析 Excel 文件,基本等于自找麻烦 —— Excel 是二进制格式(.xlsx)或 XML 套壳(.xls),不是纯文本。常见问题包括:
轻量级方案:装 phpoffice/phpspreadsheet,代码极简:
use PhpOffice\PhpSpreadsheet\IOFactory;
$spreadsheet = IOFactory::load($filePath);
$sheet = $spreadsheet->getActiveSheet();
foreach ($sheet->getRowIterator() as $row) {
$cellIterator = $row->getCellIterator();
$cellIterator->setIterateOnlyExistingCells(false);
foreach ($cellIterator as $cell) {
$value = $cell->getFormattedValue(); // 自动处理日期、数字、字符串
// 校验手机号逻辑放这里
}
}
真正容易被忽略的是:默认 getFormattedValue() 可能返回带空格的字符串,而 getValue() 在数字列可能返回 float,务必按需选择,并在后续统一 trim() 和类型判断。











