Power Query 数据处理躲坑之合并数据前去重
2017-05-22 阅读 3232

通过合并查询,我们可以快速把两张表格中的数据合并到一起,但是很多人可能会忽略掉,如果在匹配的时候如果匹配表的匹配列包含重复值,会导致原表的数据重复。


看一下我们准备的例子, “销售记录表” 和 “区域匹配表” 。


销售记录表的销售额总和为100 。在区域匹配表里“广东”出现了重复值。我们通过省份列,对两张表进行合并查询。


扩展出我们需要的“区域” 字段


在下面最终得到的结果中,广东的数据出现了重复,导致全部销售额变成了140。



为了方便大家理解,我们的示例数据非常简单。但在实际工作中,当数据量多的时候,我们可能感觉不到重复的存在。这就很容易导致最终的数据出现重复,统计数字也翻倍了。

为了避免这样的错误发生,大家在做合并查询前首先要确保匹配表的匹配列没有重复。其次,要养成在合并查询前,对匹配表的匹配列进行去重。

这样就能确保原始表的数据不会出现重复。尤其当数据量大的时候,一定记得先检查和去重,否则很难发现数据的变化。


本文出自东方瑞通,转载请注明!


更多行业干货、技术文章,请关注公众号:东方瑞通终身学习~