excel:QC soc/pt ae table小技巧
在QC soc和pt分级ae汇总表的时候遇到最头疼的问题就是source和qc侧数据集pt条数不一致,一般是因为筛选条件不同导致。
如果pt数量较多,且两边排序不一致,sas呈现的compare output不便于查看,此时就需要其他方法来快速定位source和qc侧数据集两者非共有的pt。
这里推荐使用excel进行去重处理,以下是操作流程。
用EG打开sas数据集可以直接复制整个变量到excel(SAS 9.4不支持)。

首先单击变量名选中整个列,

然后ctrl+c复制到excel,重复操作source和qc侧数据集。这样在excel里出现两列(在C列插入一个A列不存在的值“China”以作示例)。

最后选中A列和C列,然后按照以下操作可显示唯一值。


总结:
方法简单,不用进行额外的sas编程,特别适用于数量较多的soc和pt分级,能忽略双侧数据集pt排序一致才能proc compare的要求,先追求pt一致,再查看是否存在计算问题。
特别提醒:
以上虽然看起来是两列之间互相比对查找重复和唯一值,但实际上是先把两列变成单列再进行处理,如果A列存在两个相同的值比如China,而C列没有China,那么依然会算作重复值,不过在soc/pt表中pt肯定是唯一值且只属于某个soc,所以并不会影响结果。