
Pandas isin()函数:高效筛选DataFrame数据
在Pandas数据分析中,isin()函数是筛选DataFrame中符合特定条件数据的利器。本文将演示如何利用isin()函数根据指定列表筛选DataFrame的行和列。
场景:从大型DataFrame中提取特定数据
假设我们有两个DataFrame:df1包含大量数据,df2包含需要从df1中筛选的项目列表。目标是从df1中提取包含df2中所有项目的列,并整合到一个新的DataFrame中。
解决方案:巧妙运用isin()函数
Pandas的isin()函数能够高效地检查DataFrame列中的值是否包含在给定集合中。其语法如下:
df['列名'].isin(值集合)
其中:
-
df:待筛选的DataFrame -
列名:需要筛选的列名 -
值集合:包含需要查找的值的集合(列表、集合等)
实现目标的步骤:
- 遍历
df2中的每个项目。 - 使用
isin()函数在df1中筛选包含该项目的列。 - 将筛选出的列合并到一个新的DataFrame中。
代码示例:
import pandas as pd
# 创建示例DataFrame
df1 = pd.DataFrame({'uid': ['a1', 'a2', 'a3'], 'score': [1, 4, 6]})
df2 = pd.DataFrame({'uid': ['a1', 'a3']})
# 使用isin()函数筛选数据并合并
new_df = pd.DataFrame()
for uid in df2['uid']:
selected_rows = df1[df1['uid'].isin([uid])]
new_df = pd.concat([new_df, selected_rows], ignore_index=True)
# 输出结果
print(new_df)
输出结果:
uid score 0 a1 1 1 a3 6
通过以上步骤,我们成功地利用isin()函数从df1中提取了包含df2中指定项目的行,并创建了一个新的DataFrame。 此方法高效且易于理解,是Pandas数据处理中的常用技巧。










