实验送样、数据分析样品、组名命名规范
1,样品名唯一性
不管是自己做实验还是外送公司做实验,同一批送的样品,样品名字要唯一,不能有重复。
错误示例(×):a1,a2,a3,a4,a5,a5
正确示例(√):a1,a2,a3,a4,a5,a6
错误说明:错误示例中有两个a5,如果我们要对a5样品进行PCR,那么到底是处理第1个a5,还是处理第2个a5?
2,样品名要有意义,简单、易读
样品名要根据实际样品属性进行命名。
错误示例(×):a,b,c,d,e,f
正确示例(√):con_1,con_2,con_3,exp_1,exp_2,exp_3
错误说明:遇见这种纯字母的样品名,如果没有额外的记录,那么1个月以后,连你自己都无法区分你的样品了。并且reviewer看到这种样品名后,也很难知道你哪些是对照,哪些是实验,第一印象就不好。
3,样品名不能过长或过短,尽量保持均衡
样品名长度无论对于实验人员还是分析人员都是一种挑战。
如果样品名过长:
1)在录入计算机时会更容易出错(因为需要打的字更多)。
2)仪器或者软件识别不了很长的名字,例如如果以样品名作为excel的sheet名,那么长度不能超过31,超过就会截断。
3)出图的时候,长的样品名会影响图的布局或者拼图,名字可能会被截断,或者出现图被缩小或者看不见的情况。想象一下你的样品名长度为256个字符,那么这个名字在任何图上都会出问题。
4)同一批样品名字有长有短,影响视觉效果。例如做热图时,名字有的很长,有的很短,短的名字下面会出现大片空白区域。
图1. 非常长的名字影响图的布局和美观度
错误示例(×):human_tissue_control_sample_24_hour_BCG_1, human_tissue_control_sample_24_hour_BCG_24,样品名尽量使用英文体系名字
5,样品名缩写要遵循常规设定
6,样品名区分大小写
7,尽量避免同时使用1、l和I;以及0和O等

8,尽量避免使用纯数字
9,尽量避免使用特殊符号
图3. 特殊符号
10,尽量避免使用系统或者程序内置关键词
错误示例(×):con
正确示例(√):ctrl
错误说明:由于windows系统中con为系统关键词,所以我们不能将我们的样品名写作con,因为这个名字的文件根本没法在windows系统上创建,会报“指定的设备名无效”错误。
图4. 常见内置关键词(避免使用)
11,注意区分6和9、Z和2
特别对于手写的样品名,如果将6倒过来看就变成9了(图5);而2和Z的手写体也较难区分。
图5. 6还是9?此处请将手机倒置查看
正确的一般是在数字下面加一横线,在Z中间加个小横线,写成Ƶ。
12,样品名不能带空格
错误示例(×):sample 1
正确示例(√):sample_1
一般编程语言都是不允许使用带有空格的变量名的,因此尽量避免在样品名中使用空格,可以使用下划线“_”代替。
13,命名方式一致性
错误示例(×):s1,sample2,sample_3,sample-4
正确示例(√):s1,s2,s3,t4,t5,t6
错误说明:错误示例中样品名的规则很乱,让人看着不舒服。
14,比较时组名顺序
错误示例(×):control vs experiment
正确示例(√):experiment vs control
一般我们比较的时候都是实验组vs对照组,因此,请将实验组写在前面,对照组写在后边。否则比较的时候,有可能会比反(也就是上调变下调,下调变上调)。
图6. 组名顺序不一样,上下调反了
样本名、组名不仅是给自己看的,也是给实验人员,数据分析人员,reviewer看的,因此要认真对待自己的样品名,这也是一个优秀科研人员的基本素养。
附:R变量命名规则
1)变量名是区分大小写的,比如:变量y和变量Y两者是不同变量;
2)变量名的首字母不能是数字和符号,比如:2y和_xy都不能作为变量名;
3)变量名不能包含空格号,比如:my name不能作为变量名,可以用my.name或者my_name替代。
微生信助力高分文章,用户62000+,引用820+