使用Python操作Excel,删重复数据及keep参数用法并保存的例子 | 您所在的位置:网站首页 › 一列数据删除重复值 › 使用Python操作Excel,删重复数据及keep参数用法并保存的例子 |
01Ex按列标题删重复的数据 解析:我们使用了pandas库读取Excel文件,并使用drop_duplicates()函数删除重复数据。其中,subset参数指定了删除重复数据的列(列名),keep参数指定了保留哪个重复记录(默认为第一个记录)。inplace=True参数表示在原始数据上进行操作。 最后,我们使用to_excel()函数将处理后的数据,保存到一个新的Excel文件中,其中index=False参数表示不保存DataFrame的索引列。 需要注意的是,要根据实际需求修改column_name(代码,地区)为需要删除重复数据的列名。此外,如果Excel文件中包含多个Sheet,需要使用sheet_name参数指定操作哪个Sheet。 import pandas as pd # 1.读取Excel文件,参数是路径 df = pd.read_excel('表格测试.xlsx') # 2.删除重复数据,last是保留最后一个记录 # subset 参数是表格的列标题名称 df.drop_duplicates(subset=['代码','地区'], keep='first', inplace=True) #df.drop_duplicates(subset=['代码','地区'], keep='last', inplace=True) # 将处理后的数据保存到新的Excel文件 df.to_excel('example_no_duplicates.xlsx', index=False) # 3.读取保存好的Excel文件 data = pd.read_excel('example_no_duplicates.xlsx') # 输出新的Excel文件中的数据 print(data)02 Excel中删除重复数据并保存 import pandas as pd # 读取Excel文件,并加载数据 df = pd.read_excel('表格测试.xlsx') # 利用pandas的drop_duplicates方法删除重复数据 df.drop_duplicates(inplace=True) # 保存修改后的数据到新的Excel文件 df.to_excel('example_distinct.xlsx', index=False)03 循环边遍历列表 import openpyxl # 打开Excel文件 wb = openpyxl.load_workbook('example.xlsx') # 选择Excel文件中的Sheet sheet = wb['Sheet1'] # 循环遍历所有单元格,并加1处理 for i in range(1, sheet.max_row+1): for j in range(1, sheet.max_column+1): cell = sheet.cell(row=i, column=j) if isinstance(cell.value, (int, float)): cell.value = cell.value + 1 # 保存修改后的Excel文件 wb.save('example_new.xlsx')当下这个大数据时代不掌握一门编程语言怎么跟的上时代呢?当下最火的编程语言Python前景一片光明!如果你也想跟上时代提升自己那么请看一下. 感兴趣的小伙伴,赠送全套Python学习资料,包含面试题、简历资料等具体看下方。 一、Python所有方向的学习路线 Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具 工具都帮大家整理好了,安装就可直接上手! 三、最新Python学习笔记 当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。 四、Python视频合集 观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。 五、实战案例 纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。 六、面试宝典 ![]() ![]() |
CopyRight 2018-2019 实验室设备网 版权所有 |