当数据表某一列存在重复值时,通常需要统计该列中每个不同值的出现频次。在excel中,这一操作常通过countif函数完成;而在pandas中,则可通过内置方法高效实现去重及频次统计。
1、 当数据表中的某个字段包含重复内容时,常规处理方式是统计各唯一值的出现次数。相比Excel中的COUNTIF函数,Pandas提供了更为灵活和强大的数据操作功能来完成此类任务。
2、 首先导入pandas库

3、 接着读取外部Excel数据文件

4、 三、查看数据结构信息

5、 在加载Excel数据时,并未将“姓名”列设置为索引,因其可能存在重复项,若强制设为索引可能导致数据对齐问题或引发异常,影响后续分析准确性。
6、 四、执行去重与频次统计

7、 五、进行数据筛选操作











