使用Python操作Excel，删重复数据及keep参数用法并保存的例子

2024-07-10 13:58| 来源: 网络整理| 查看: 265

01Ex按列标题删重复的数据

解析：我们使用了pandas库读取Excel文件，并使用drop_duplicates()函数删除重复数据。其中，subset参数指定了删除重复数据的列（列名），keep参数指定了保留哪个重复记录（默认为第一个记录）。inplace=True参数表示在原始数据上进行操作。

最后，我们使用to_excel()函数将处理后的数据，保存到一个新的Excel文件中，其中index=False参数表示不保存DataFrame的索引列。

需要注意的是，要根据实际需求修改column_name（代码，地区）为需要删除重复数据的列名。此外，如果Excel文件中包含多个Sheet，需要使用sheet_name参数指定操作哪个Sheet。

import pandas as pd # 1.读取Excel文件，参数是路径 df = pd.read_excel('表格测试.xlsx') # 2.删除重复数据，last是保留最后一个记录 # subset 参数是表格的列标题名称 df.drop_duplicates(subset=['代码','地区'], keep='first', inplace=True) #df.drop_duplicates(subset=['代码','地区'], keep='last', inplace=True) # 将处理后的数据保存到新的Excel文件 df.to_excel('example_no_duplicates.xlsx', index=False) # 3.读取保存好的Excel文件 data = pd.read_excel('example_no_duplicates.xlsx') # 输出新的Excel文件中的数据 print(data)

02 Excel中删除重复数据并保存

import pandas as pd # 读取Excel文件,并加载数据 df = pd.read_excel('表格测试.xlsx') # 利用pandas的drop_duplicates方法删除重复数据 df.drop_duplicates(inplace=True) # 保存修改后的数据到新的Excel文件 df.to_excel('example_distinct.xlsx', index=False)

03 循环边遍历列表

import openpyxl # 打开Excel文件 wb = openpyxl.load_workbook('example.xlsx') # 选择Excel文件中的Sheet sheet = wb['Sheet1'] # 循环遍历所有单元格，并加1处理 for i in range(1, sheet.max_row+1): for j in range(1, sheet.max_column+1): cell = sheet.cell(row=i, column=j) if isinstance(cell.value, (int, float)): cell.value = cell.value + 1 # 保存修改后的Excel文件 wb.save('example_new.xlsx')

当下这个大数据时代不掌握一门编程语言怎么跟的上时代呢？当下最火的编程语言Python前景一片光明！如果你也想跟上时代提升自己那么请看一下.

在这里插入图片描述