欢迎光临散文网 会员登陆 & 注册

作为DM,当我们谈论excel,我们在谈论什么?

2023-07-03 19:15 作者:艾家E小二-excel  | 我要投稿

作为数据管理员,excel在我们的工作和生活里占据了无比重要的位置。无论是用来记录、呈现,还是核查、分析,它似乎无处不在,似乎无所不能。直到有一天,有人告诉我们时代变了,SAS已经普及,AI将要来临,excel似乎又成了笨拙和繁琐的代名词。真的如此吗?我们真的已经挖掘了excel全部的潜力,吸收了excel全部的营养了吗?回望十载,我不禁在想,当我们谈论excel,我们在谈论什么?

置身于一个临床试验的数据流,我们发现excel以其易用性被几乎所有部门借用。但从source到CSR,excel并不作为任何部门的“结果”和“目标”。是的,Excel本身不是“目标”,而只是我们实现目标的一个“工具”。

让我们先来想象这样一个场景:医学需要核查不良事件是否有潜在的重叠或重复记录。

作为一个DM,我该如何向编程同事描述这个需求,让他帮我编写一条完美的SAS核查程序呢?仅仅是告诉编程同事:“如果同一个受试者两个名称相同的AE时间重叠,就需要报告为潜在数据问题”就够了吗?让我们回归Excel,似乎需要注意的事情还有很多。比如:未痊愈的AE缺失结束日期,是否影响计算?前一条的结束日期等于后一条的开始日期是否判断为“重叠”?遇到开始日期未知如何处理?如果是结束日期未知,处理方法与开始日期未知是相同的吗?甚至是最基础的问题,编程同事写的“重叠核查”,到底是怎么判断“重叠”的?

如果没有以excel为基础进行过核查,DM很难设想到问题出现的方方面面。如果在excel里都没有思路如何去进行核查,又从何谈起对这些问题如何决策和解决。如果很幸运,你有一位经验丰富、能力卓越的编程同事,从你提出的模糊的需求中,设想到了每一种情况并正确处理,那其实反而是一种不幸。编程已经覆盖了DM的工作,那不如让让医学直接向编程提需求,有或者没有DM在中间作为传声筒又有什么区别?

唯有真正用excel自己去核查过,才能知其然,知其所以然。只有遇到了,才会对未知日期的处理有疑虑,才会权衡首尾相连的AE如何取舍。DM通过与医学讨论,将各种特殊情况及其处理方法都明晰到提给编程的需求中,才是合格的“提需求”的能力。

更进一步的,如果在excel里我们能用函数便捷地进行核查,那函数的思路也对SAS程序有积极的借鉴意义。还是这个例子里,当完成数据的修饰后,我们发现,如果AE1的结束日期晚于AE2的开始日期,同时AE2的结束日期晚于AE1的开始日期,这两条AE就是重叠的。这个excel中经过无数次验算和优化过的逻辑,同样能非常方便的应用到SAS程序中。话说回来,当年入行之时,编程同事是完全不负责数据核查工作的,许多年过去,编程的路走宽了。

再来看另一个例子,RECIST v1.1评估靶病灶时,需要取值获得之前所有访视中最小的直径之和。最简单粗暴的方法就是用SAS在每个访视都对前面历次访视取值比较,但在下图中,其实一个非常简单的公式就能实现递归运算。当数据量异常庞大时,便捷的思路有可能很大程度上解放SAS的算力。

Excel是工具,就如SAS,AI同样是工具。SAS的强大与AI的前景毋庸置疑, excel的灵活易用也显而易见。对于我们要完成的任务,使用何种工具没有高低贵贱。更重要的是对于完成任务的我们,工具能带给我们什么?我们如何对待工具,就是在如何对待我们的工作,如何对待我们自己。

你依然对工具的潜力保有好奇,还是对自己的工作按部就班?你依然尝试用工具解决问题,还是把困难的任务丢给别人?你依然认为没有人比DM更懂数据,还是要依靠别人提示问题和风险?能够拓展Excel作为工具的深度和广度,也同样能够拓展DM这份事业的深度和广度。

 

作为DM,当我们谈论Excel,我们在谈论我们自己。


作为DM,当我们谈论excel,我们在谈论什么?的评论 (共 条)

分享到微博请遵守国家法律