python pandas取交集、并集、差集 | 您所在的位置:网站首页 › pandas比较两个dataframe › python pandas取交集、并集、差集 |
对于colums都相同的dataframe做过滤的时候 例如: df1 = DataFrame([['a', 10, '男'], ['b', 11, '男'], ['c', 11, '女'], ['a', 10, '女'], ['c', 11, '男']], columns=['name', 'age', 'sex']) df2 = DataFrame([['a', 10, '男'], ['b', 11, '女']], columns=['name', 'age', 'sex']) 取交集:print(pd.merge(df1,df2,on=['name', 'age', 'sex'])) 取并集:print(pd.merge(df1,df2,on=['name', 'age', 'sex'], how='outer')) 取差集(从df1中过滤df1在df2中存在的行): df1 = df1.append(df2) df1 = df1.append(df2) df1 = df1.drop_duplicates(subset=['name', 'age', 'sex'],keep=False) print(df1) |
CopyRight 2018-2019 实验室设备网 版权所有 |