实战技巧：Excel高效合并两列数据并剔除重复项

2026/6/29 10:52:15

在日常工作中，我们经常会遇到需要合并多列数据的情况。比如销售部门和市场部门各自维护了一份客户名单，领导要求你整合成一份完整的客户资料；又或者你在整理产品信息时，不同渠道提供的产品编号存在重复。这时候就需要把两列数据合并起来，同时剔除重复项。

我遇到过最头疼的情况是处理来自5个分公司的客户数据，每份表格的格式都不统一，有的用手机号作为客户ID，有的用邮箱，还有的用自定义编号。最终花了整整一天时间才把这些数据清洗干净。从那以后我就养成了定期整理数据源的习惯，也积累了一些高效处理这类问题的方法。

数组公式是Excel中非常强大的功能，可以同时对一组值进行运算。对于合并两列并去重这个需求，我们可以使用以下公式：

=IFERROR( INDEX($B$2:$B$100, MATCH(0, COUNTIF($D$1:D1, $B$2:$B$100), 0)), INDEX($A$2:$A$100, MATCH(0, COUNTIF($D$1:D1, $A$2:$A$100), 0)) )

这个公式的工作原理是这样的：

在使用这个公式时，有几个关键点需要注意：

我建议在使用前先备份原始数据，因为数组公式一旦出错可能会影响大量单元格。另外，如果数据量很大（超过1万行），数组公式可能会导致Excel运行变慢，这时候可以考虑使用其他方法。

对于不太熟悉公式的用户，Excel自带的"删除重复项"功能可能更友好。操作步骤如下：

这个方法简单直接，但有个缺点：它会直接修改原始数据。所以我通常会在操作前先复制一份到新的工作表。

数据透视表是另一个强大的工具，可以用来合并和去重：

这个方法的好处是可以随时刷新数据透视表来更新结果，而且不会修改原始数据。我经常用它来做临时性的数据检查。

当数据量达到数万行时，数组公式可能会让Excel变得非常卡顿。这时候可以考虑：

使用Power Query（Excel 2016及以上版本内置）
- 在"数据"选项卡中选择"获取数据"
- 将两列数据导入Power Query编辑器
- 使用"合并列"和"删除重复项"功能
- 加载回Excel工作表
分批次处理数据
- 将数据分成多个小批次处理
- 使用辅助列标记已处理的数据
- 最后合并所有批次的唯一值

有时候数据中可能包含：

这时候需要先对数据进行标准化处理：

=TRIM(CLEAN(UPPER(A2)))

这个组合公式会先清理不可见字符，然后去除首尾空格，最后统一转为大写，确保比较时不会因为格式问题漏掉重复项。

假设我们有以下两列数据：

我们要在D列生成合并后的唯一客户列表。

步骤1：在D2单元格输入数组公式

=IFERROR( INDEX($B$2:$B$30, MATCH(0, COUNTIF($D$1:D1, $B$2:$B$30), 0)), INDEX($A$2:$A$20, MATCH(0, COUNTIF($D$1:D1, $A$2:$A$20), 0)) )

按Ctrl+Shift+Enter确认输入。

步骤2：向下拖动填充公式，直到出现#N/A错误。

步骤3：选中D列结果，复制后"选择性粘贴"为值，避免公式计算带来的性能问题。

这个案例中，我通常会额外添加一个辅助列来标注每个客户来自哪个部门，方便后续分析。可以使用类似这样的公式：

=IF(ISNUMBER(MATCH(D2,$A$2:$A$20,0)),"市场部","销售部")

在处理大量数据时，我总结出几个提升效率的技巧：

有一次我处理一个5万行的数据集，最初用了整列引用，Excel几乎卡死。后来改为精确引用具体范围后，处理时间从10分钟缩短到30秒。这个教训让我深刻理解了优化公式的重要性。

下表比较了几种不同方法的优缺点：