Python实现对比两个Excel数据内容并标记出不同

2024-06-09 12:48| 来源: 网络整理| 查看: 265

下面是Python实现对比两个Excel数据内容并标记出不同的完整实例教程。

实现思路

本文使用Python语言，利用pandas库读取Excel文件，并将数据转换为DataFrame数据结构。利用DataFrame提供的函数对两个Excel表格进行比对，找寻不同的内容，并在新的Excel表格中标记出不同的内容。

读取Excel文件，将数据转换为DataFrame格式。通过pandas库提供的判断方法，判断两个DataFrame之间的差异（相同或不相同）。将不同的内容标记出并输出到新的Excel文档中。具体实现步骤安装pandas库

使用pip安装pandas库：

pip install pandas

安装完成后，我们可以开始编写代码了。

导入需要的库 import pandas as pd 读取Excel文件，将数据转换为DataFrame格式。 data1 = pd.read_excel('data1.xlsx') data2 = pd.read_excel('data2.xlsx') 对比两个文件的不同之处。 diff = pd.concat([data1, data2]).drop_duplicates(keep=False)

concat函数将两个DataFrame合并为一个，drop_duplicates函数删除重复行。

输出差异到新的Excel文件中。 diff.to_excel('diff.xlsx', index=False, header=True) 示例说明

以一个简单的实例说明这个程序的使用。

假设有两个Excel文件，分别为data1.xlsx和data2.xlsx，文件内容如下：

data1.xlsx

序号姓名年龄 1 张三 20 2 李四 22 3 王五 19

data2.xlsx

序号姓名年龄 1 张三 20 2 李四 23 3 王五 19

我们将这两个文件放在同一个文件夹内，然后编写以下代码：

import pandas as pd data1 = pd.read_excel('data1.xlsx') data2 = pd.read_excel('data2.xlsx') diff = pd.concat([data1, data2]).drop_duplicates(keep=False) diff.to_excel('diff.xlsx', index=False, header=True)

执行完以上程序后，就会出现一个新的Excel文件diff.xlsx，其中标记了第二个文件与第一个文件的不同之处：

序号姓名年龄 2 李四 23

又以另一组数据为例：

data1.xlsx

工号姓名部门 001 张三技术部 002 李四人事部 003 王五财务部

data2.xlsx

工号姓名部门 001 张三技术部 002 刘六人事部 003 王五财务部

程序代码如下：

执行完以上程序后，将出现一个新的Excel文件diff.xlsx，其中标记了第二个文件与第一个文件的不同之处：

工号姓名部门 002 刘六人事部

这个程序可以应用于各种类型的数据之间的比较和高效匹配。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Python实现对比两个Excel数据内容并标记出不同 - Python技术站

【本文地址】

公司简介

联系我们