Python实现对比两个Excel数据内容并标记出不同 | 您所在的位置:网站首页 › Compare工具如何两列不同行 › Python实现对比两个Excel数据内容并标记出不同 |
下面是Python实现对比两个Excel数据内容并标记出不同的完整实例教程。 实现思路本文使用Python语言,利用pandas库读取Excel文件,并将数据转换为DataFrame数据结构。利用DataFrame提供的函数对两个Excel表格进行比对,找寻不同的内容,并在新的Excel表格中标记出不同的内容。 读取Excel文件,将数据转换为DataFrame格式。 通过pandas库提供的判断方法,判断两个DataFrame之间的差异(相同或不相同)。 将不同的内容标记出并输出到新的Excel文档中。 具体实现步骤 安装pandas库使用pip安装pandas库: pip install pandas安装完成后,我们可以开始编写代码了。 导入需要的库 import pandas as pd 读取Excel文件,将数据转换为DataFrame格式。 data1 = pd.read_excel('data1.xlsx') data2 = pd.read_excel('data2.xlsx') 对比两个文件的不同之处。 diff = pd.concat([data1, data2]).drop_duplicates(keep=False)concat函数将两个DataFrame合并为一个,drop_duplicates函数删除重复行。 输出差异到新的Excel文件中。 diff.to_excel('diff.xlsx', index=False, header=True) 示例说明以一个简单的实例说明这个程序的使用。 假设有两个Excel文件,分别为data1.xlsx和data2.xlsx,文件内容如下: data1.xlsx 序号 姓名 年龄 1 张三 20 2 李四 22 3 王五 19data2.xlsx 序号 姓名 年龄 1 张三 20 2 李四 23 3 王五 19我们将这两个文件放在同一个文件夹内,然后编写以下代码: import pandas as pd data1 = pd.read_excel('data1.xlsx') data2 = pd.read_excel('data2.xlsx') diff = pd.concat([data1, data2]).drop_duplicates(keep=False) diff.to_excel('diff.xlsx', index=False, header=True)执行完以上程序后,就会出现一个新的Excel文件diff.xlsx,其中标记了第二个文件与第一个文件的不同之处: 序号 姓名 年龄 2 李四 23又以另一组数据为例: data1.xlsx 工号 姓名 部门 001 张三 技术部 002 李四 人事部 003 王五 财务部data2.xlsx 工号 姓名 部门 001 张三 技术部 002 刘六 人事部 003 王五 财务部程序代码如下: import pandas as pd data1 = pd.read_excel('data1.xlsx') data2 = pd.read_excel('data2.xlsx') diff = pd.concat([data1, data2]).drop_duplicates(keep=False) diff.to_excel('diff.xlsx', index=False, header=True)执行完以上程序后,将出现一个新的Excel文件diff.xlsx,其中标记了第二个文件与第一个文件的不同之处: 工号 姓名 部门 002 刘六 人事部这个程序可以应用于各种类型的数据之间的比较和高效匹配。 本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python实现对比两个Excel数据内容并标记出不同 - Python技术站 |
CopyRight 2018-2019 实验室设备网 版权所有 |