php实现班级通信录导入重复数据_php去重导入处理方法【技巧】

雪夜

发布时间：2026-01-25 18:55:10

372人浏览过

来源于php中文网

原创

fgetcsv读取Excel导出的CSV时因UTF-8 BOM未自动剥离导致去重失效，需用ltrim($line, "\xEF\xBB\xBF")预处理；同时应清洗零宽字符、使用事务保证原子性，并借助ON DUPLICATE KEY UPDATE高效处理重复。

php实现班级通信录导入重复数据_php去重导入处理方法【技巧】

为什么 `fgetcsv` 读取 Excel 导出的 CSV 会多出 BOM 头导致去重失效

很多班级通信录是老师用 Excel 编辑后另存为 CSV 的，这类文件开头常带 UTF-8 BOM（\xEF\xBB\xBF），但 fgetcsv 不自动剥离。结果同样是“张三”，一条是 "张三"，另一条是 "\xEF\xBB\xBF张三"，用 array_unique 或数据库 UNIQUE 都判为不同。

实操建议：

立即学习“PHP免费学习笔记（深入）”；

读取每行前先用 ltrim($line, "\xEF\xBB\xBF") 去 BOM，别只依赖 mb_convert_encoding
用 hexdump -C file.csv | head -n1 检查原始文件是否含 BOM（开头出现 ef bb bf）
如果用 str_getcsv 处理单行，也要对字段逐个 trim() + ltrim(..., "\xEF\xBB\xBF")

用 `INSERT ... ON DUPLICATE KEY UPDATE` 还是先 `SELECT` 再判断

班级通信录导入常见主键是学号或手机号，设为 UNIQUE 后，直接走 MySQL 的冲突处理比 PHP 层查再插快得多，尤其批量超 50 条时。

实操建议：

立即学习“PHP免费学习笔记（深入）”；

建表时给 student_id 或 phone 加 UNIQUE 索引，否则 ON DUPLICATE KEY 不生效
SQL 示例：INSERT INTO class_contact (student_id, name, phone) VALUES (?, ?, ?) ON DUPLICATE KEY UPDATE name=VALUES(name), phone=VALUES(phone)
避免用 REPLACE INTO：它本质是删+插，会引发自增 ID 跳变、触发器重复执行
如果要记录“本次跳过几条重复数据”，可在 PHP 中捕获 mysqli_affected_rows() 返回值：0 表示冲突更新（即原记录存在），1 表示新插入

PHP 数组去重时，`array_unique` 默认不比较中文字段？

array_unique 默认用 string 比较，对 UTF-8 中文没问题，但前提是所有字段已统一编码且无不可见字符（如全角空格、零宽空格）。班级名单里常混入从微信复制的姓名，带 \xE2\x80\x8B（Zero Width Space）。

PathFinder

AI驱动的销售漏斗分析工具

下载

实操建议：

立即学习“PHP免费学习笔记（深入）”；

清洗字段时加一步：preg_replace('/[\x{200B}-\x{200D}\x{FEFF}]/u', '', $str)（移除常见零宽字符）
用 array_unique($data, SORT_REGULAR)，别用 SORT_STRING（后者会强制转字符串，可能把数字学号变成字符串再比，影响逻辑）
调试时用 bin2hex($name) 看实际字节，比肉眼判断更可靠

导入中途失败，怎么保证已入库数据不残留“半条记录”

班级通信录常含多个关联字段（如学生、班级、家长电话），如果用单条 INSERT 循环，某条因手机号格式错误中断，前面成功的就留在库中，下次重跑又重复——这不是去重问题，是事务缺失。

实操建议：

立即学习“PHP免费学习笔记（深入）”；

整个导入过程包在 mysqli_begin_transaction() + try/catch 里，失败则 rollback()
不要在循环里逐条 commit，等全部验证通过再 commit()
若必须分批（比如 500 条一批），每批独立事务，并记录最后成功导入的 student_id 到临时表，供断点续传用

真正麻烦的不是重复本身，而是“看起来去重了，其实因编码/空白/事务问题漏掉了某些重复场景”。每次上线前，拿含 BOM、带零宽空格、手机号中间有空格的测试文件跑一遍，比写十遍逻辑更管用。

PHP 数据库 explain 结果解读技巧

宝塔面板如何安装WordPress_一键部署WordPress网站方法【教程】

Swoole连接池故障怎么修_Swoole池化问题排查步骤【介绍】

宝塔面板适合新手建站吗_面板功能与优势说明【解答】

php如何查看数据库版本_获取mysql版本的sql语句【说明】

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

mysql php excel 微信编码字节 csv sql mysql String select try catch 字符串循环 bom 数据库 excel

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：php页面渐变能结合CSS变量吗_php页面变量控渐变法【技巧】下一篇：trae里php的zend_extension怎么加_trae加zend扩展法【技巧】

作者最新文章

番茄音乐怎么设置来电铃声_番茄音乐设置铃声方法

2026-03-12 12:35

曝华为Pura 90仍采用三角形镜头模组后壳材质有变化

2026-03-12 12:38

搜有答题红包签到_搜有答题红包签到操作指南【攻略】

2026-03-12 12:41

怎么关闭或修改响应中的X-Powered-By信息_响应头隐藏【说明】

2026-03-12 12:45

2025企微SCRM实测：永久会话存档成合规刚需，微伴凭"数据资产化"领跑6强

2026-03-12 13:00

看这家公司如何用社交小程序,3天实现5000+粉丝增长!

2026-03-12 13:02

腾讯会议怎么连接会议室设备_腾讯会议Rooms硬件接入配置

2026-03-12 13:26

小程序+快闪店,限时快闪玩法!

2026-03-12 13:27

作业帮难题解析免费网站地址-作业帮最全学习工具在线免费使用入口

2026-03-12 13:35

鸣潮慌乱的迁徙第五关怎么过-鸣潮慌乱的迁徙第五关攻略

2026-03-12 13:37

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1134

2023.10.12

SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法

在SQL中，MONTHS_BETWEEN 是一个常见的函数，用于计算两个日期之间的月份差。想了解更多SQL的相关内容，可以阅读本专题下面的文章。

381

2024.02.23

SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容，可以阅读本专题下面的文章。

2174

2024.03.06

sql procedure语法错误解决方法

sql procedure语法错误解决办法：1、仔细检查错误消息；2、检查语法规则；3、检查括号和引号；4、检查变量和参数；5、检查关键字和函数；6、逐步调试；7、参考文档和示例。想了解更多语法错误的相关内容，可以阅读本专题下面的文章。

380

2024.03.06

oracle数据库运行sql方法

运行sql步骤包括：打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果，错误消息或退出sql plus。想了解更多oracle数据库的相关内容，可以阅读本专题下面的文章。

1703

2024.04.07

sql中where的含义

sql中where子句用于从表中过滤数据，它基于指定条件选择特定的行。想了解更多where的相关内容，可以阅读本专题下面的文章。

586

2024.04.29

sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name；该语句将永久删除指定表的表和数据。想了解更多sql的相关内容，可以阅读本专题下面的文章。

440

2024.04.29

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

热门下载

网站特效

网站源码

网站素材

前端模板