【Python | 您所在的位置:网站首页 › 表格数据怎么去重 › 【Python |
写在前面的Tips: 使用函数drop_duplicates其中参数subset可以指定按照某字段进行去重。效果如下图![]() 下面是代码演示 import pandas as pd import openpyxl datadir = r"C:\Users\Haley\Desktop\test_duplicates_data.xlsx" data = pd.read_excel(datadir, sheet_name='OriginalData') data_new = data.drop_duplicates(subset=['name'], keep='first', inplace=False) #inplace:默认为False. True:直接在原数据上删除重复项 False: 删除重复项后返回副本 print(data_new) wb = openpyxl.load_workbook(datadir) #如果有多个模块可以读写excel文件,这里要指定engine,否则可能会报错 writer = pd.ExcelWriter(datadir,engine='openpyxl') #没有下面这个语句的话excel表将完全被覆盖 writer.book = wb data_new.to_excel(writer, index=True, sheet_name='Output') writer.save()源数据长这样: |
CopyRight 2018-2019 实验室设备网 版权所有 |