欢迎光临散文网 会员登陆 & 注册

你可能根本不知道的GEO数据查询技巧

2022-08-05 10:46 作者:尔云间  | 我要投稿


01 常规筛选

在GEO数据库搜索所需数据集的时候,条目太多,一个个点进去筛选耗时耗力,效率不高。

通常我们可以通过geo界面左右两侧给的一些选项进行筛选

数据记录类型:atasets、series、samples和platforms

选择来源物种

测序平台:DNA、mRNA、SNP、甲基化等等


限定作者


限定样本类型


限定数据上传时间


02 检索式搜索

上述是网上经常提到的筛选方法,但今天我发现一个有意思的地方,感觉可以探索一下
当我以“undifferentiated carcinoma”为关键词进行搜索时

它右侧输入框显示"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]


当我们点击See more出现以下界面


Query Translation这里提示我也可以在GEO使用检索式进行检索

针对"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]这一命令进行解读

它是在关键词MeSH Terms中对carcinoma进行精确搜索,OR 或 ,在所有字段[All Fields]中搜索undifferentiated carcinoma。

而我们在搜索框中输入的undifferentiated carcinoma,我是想对undifferentiated carcinoma进行一个精确的搜索,通常使用双引号””便可进行精确搜索

我们可以看到在进行精确搜索前我们得到了238298条数据,而精确搜索后就只有64条数据,有量级的差别

这也说明了我们是可以在GEO数据库使用检索式进行搜索

而我们也可以使用All Fields,Title,MeSH Terms,Description这些限定检索字段


上图显示[Description]是被正常识别的

当然一些常规的符号也是能识别的,比如:

“|”或——并行搜索、

“-”非——消除无关性、

“+”加号 —— 强制包含关键词

这里|就被识别为了OR,当然你也可以直接输入OR。




你可能根本不知道的GEO数据查询技巧的评论 (共 条)

分享到微博请遵守国家法律