SDTM domain和dataset的区别
SDTM Implementation Guide⾥⾯会反复出现domain(域)和dataset(数据
集)这两个术语,今天我们来看下这两个术语的区别。
Domain(域)是指⼀个逻辑相关并且具有共同特定主题的观测数据的集合。观
测数据通常收集了⼀个临床试验中所有受试者的数据。
Dataset(数据集)是指⼀个集合了结构化数据的单⼀⽂件。
简⽽⾔之,域是⼀组相关的观测数据组,⽽数据集是指与该组观测数据相关联的
数据结构。域和数据集都使⽤相同的命名法,这就是它们经常混淆的原因。
什么情况下会需要区分这两种术语呢?当需要做拆分动作的时候:
LB domain太⼤
QS domain按照问卷类型进⾏拆分
FA domain按照parent domain(⽗域)进⾏拆分
然⽽,由于在⼤多数情况下,域和基于该域的数据集之间存在⼀对⼀的关系,并
且它们的命名规则相同,因此在许多情况下它们是可以互换使⽤的。
注意在关联数据集(RELREC, SUPP--)中,没有DOMAIN这个变量,取⽽代之
的是RDOMAIN变量,它是⽤来记录关联域信息的。
在RELREC⾥,如果要体现⼀个拆分的Findings About domain,则RDOMAIN放的是4个字符的数据集名称,如下:

拆分数据集的SUPP--数据集(⽐如FACM的SUPP--数据集SUPPFACM)中的RDOMAIN值为2个字符的domain名字, ⽐如SUPPFACM.RDOMAIN='FA'。