Python实现对比两个Excel数据内容并标记出不同 您所在的位置:网站首页 Compare工具如何两列不同行 Python实现对比两个Excel数据内容并标记出不同

Python实现对比两个Excel数据内容并标记出不同

2024-06-09 12:48| 来源: 网络整理| 查看: 265

下面是Python实现对比两个Excel数据内容并标记出不同的完整实例教程。

实现思路

本文使用Python语言,利用pandas库读取Excel文件,并将数据转换为DataFrame数据结构。利用DataFrame提供的函数对两个Excel表格进行比对,找寻不同的内容,并在新的Excel表格中标记出不同的内容。

读取Excel文件,将数据转换为DataFrame格式。 通过pandas库提供的判断方法,判断两个DataFrame之间的差异(相同或不相同)。 将不同的内容标记出并输出到新的Excel文档中。 具体实现步骤 安装pandas库

使用pip安装pandas库:

pip install pandas

安装完成后,我们可以开始编写代码了。

导入需要的库 import pandas as pd 读取Excel文件,将数据转换为DataFrame格式。 data1 = pd.read_excel('data1.xlsx') data2 = pd.read_excel('data2.xlsx') 对比两个文件的不同之处。 diff = pd.concat([data1, data2]).drop_duplicates(keep=False)

concat函数将两个DataFrame合并为一个,drop_duplicates函数删除重复行。

输出差异到新的Excel文件中。 diff.to_excel('diff.xlsx', index=False, header=True) 示例说明

以一个简单的实例说明这个程序的使用。

假设有两个Excel文件,分别为data1.xlsx和data2.xlsx,文件内容如下:

data1.xlsx

序号 姓名 年龄 1 张三 20 2 李四 22 3 王五 19

data2.xlsx

序号 姓名 年龄 1 张三 20 2 李四 23 3 王五 19

我们将这两个文件放在同一个文件夹内,然后编写以下代码:

import pandas as pd data1 = pd.read_excel('data1.xlsx') data2 = pd.read_excel('data2.xlsx') diff = pd.concat([data1, data2]).drop_duplicates(keep=False) diff.to_excel('diff.xlsx', index=False, header=True)

执行完以上程序后,就会出现一个新的Excel文件diff.xlsx,其中标记了第二个文件与第一个文件的不同之处:

序号 姓名 年龄 2 李四 23

又以另一组数据为例:

data1.xlsx

工号 姓名 部门 001 张三 技术部 002 李四 人事部 003 王五 财务部

data2.xlsx

工号 姓名 部门 001 张三 技术部 002 刘六 人事部 003 王五 财务部

程序代码如下:

import pandas as pd data1 = pd.read_excel('data1.xlsx') data2 = pd.read_excel('data2.xlsx') diff = pd.concat([data1, data2]).drop_duplicates(keep=False) diff.to_excel('diff.xlsx', index=False, header=True)

执行完以上程序后,将出现一个新的Excel文件diff.xlsx,其中标记了第二个文件与第一个文件的不同之处:

工号 姓名 部门 002 刘六 人事部

这个程序可以应用于各种类型的数据之间的比较和高效匹配。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python实现对比两个Excel数据内容并标记出不同 - Python技术站



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有