文献检索与管理类工具分享
2023-03-15 10:52 作者:今晚の月は綺麗ですね | 我要投稿


大家下午好,今天 我想和大家分享的是 文献检索与管理类工具。今天分享的内容 主要包括三个方面:首先,在文献检索方面 如何提高查全率与查准率;其次,如何又快又准下载中英文文献原文;再次,就是介绍一下文献管理的主流工具 以及其中NE的使用方法(还有一点,就是本次分享所指文献检索仅包括期刊文章检索,专利检索等其他检索暂不做介绍。文献检索中所介绍数据库也是针对生物医药方面的数据库)

据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。科研人员花费在科技出版物上的时间为全部科研时间的60%。
文献检索与阅读是一切科学研究的入口!

文献检索的工具非常多,(点击)像大家熟悉的知网维普万方;(点击)还有所有学术类数据库中下载量最大的 Sciencedirector,整合了全球最大学术图书出版公司 施普林格出版资源的 springer link,还有全球第三大学术期刊出版商John Wiley 旗下的Wiley online Library;整合了国内最权威的医学专业文摘型数据库 CBM 的中国生物医学文献服务系统(SinoMed)。~~,英文第二大常用数据库EmBase,全世界最大的摘要和引文数据库Scopus,拥有SCI、SSCI、A&HCI的科睿维安旗下的WOS,百度学术和谷歌学术,还有我们大名鼎鼎的 Pubmed
那么,五花八门的检索工具之间又有什么区别呢?

我将前边介绍的文献检索工具按照其属性进行了分类,文献数据库主要分为全文数据库和摘要索引型数据库,其中中文全文数据库主要包括知网维普万方,比较著名的外文全文数据库主要包括全球三大学术出版商旗下的基于自身出版期刊的全文数据库,中文摘要索引型数据库主要包括~~~,外文摘要索引型数据库主要包括~的~~~,~的~~~。
两种文献数据库的区别主要在于用户在全文数据库中可以直接下载文献,而文摘型数据库只提供了全文链接,无法下载全文,用户需要点击链接前往期刊官网进行下载。(点下一页)

我们可以把查文献想作看电影,这样就比较好理解了。(点击)出品过权力的游戏和西部世界的HBO,还有出品过纸牌屋、黑镜的网飞,这些可以点播自有版权影视剧的视频网站,就类似于可以下载自有文献库的外文全文数据库;
国内的视频网站爱优腾可以对标数据库知网维普万方;(点击)
国外著名的电影评分网站:烂番茄和IMDB,二者都有各自的评分方法和推荐的TOP电影,这一点就类似于爱思维尔用Cite Score等指标对文章进行评分;科睿维安用IF来对文章进行评分,并把IF较高的收录为SCI 和 SSCI;(点击)
国内的电影评分网站:豆瓣、时光、和猫眼也可以类比成sinomed、CSCD等(点击)
那么大家看影评,选电影会选用哪个APP呢?是不是应该选用没有版权限制、信息更为全面的影评类APP呀!(点下一页)

那举一反三,大家想要检索较为全面的文献应该选用哪种类型的数据库呢?
检索文献一般选用摘要索引型数据库,因为这类数据库只有文摘所以它不受版权的限制,并且评分机制较为全面
此外,我们也可以选用学术搜索引擎例如百度、Google、Bing等检索文献,它们的工作原理是爬虫技术爬取互联网信息后放入服务器并编制索引,用户检索时服务器提取相关结果并采用算法排序后呈现给用户。但学术搜索引擎普遍存在更新不及时的问题。(点击下一页)

根据刚才的分类我们知道如果想查全目标领域文章,需要选用摘要索引型数据库,Sinomed 整合了 国内最权威的医学专业文摘型数据库CBM,基本可以将中文文献一网打尽,但是sinomed的使用需要购买了该数据库机构或学校的代理账号,可以挂学校的VPN来使用。如果没有账号的话可以使用免费的学术搜索引擎:比如百度学术,百度学术 学术资源覆盖面广泛全面,但文献更新速度慢;虽然学术界苦知网久矣,但知网独家收录了大量预防医学和生物医药的中文期刊,许多中文文章的网络首发还是在知网,因此百度学术搭配知网一起食用最佳(大家如果还有时间也可以在看一下万方目标领域的最新文章,因为万方是独家收录了中华医学会文章的)
如果想查全目标领域的外文文献,第一种方法就是使用 pubmed +Embase 的组合,如果想更全一点,可以再利用科睿维安旗下的Web of science查一下目标领域的sci文章;刚在我们说到,百度学术搭配知网使用是因为更新速度问题,那pubmed 为什么要搭配 Embase 呢?在此,我先简要介绍一下这两个数据库,pubmed是美国国立卫生院(NIH)下属的国立医学图书馆(NLM)的国家生物信息中心(NCBI)研发及维护的生物医学数据库平台,引文来源主要包括Medline、Pubmed Central等数据库,覆盖学科方面偏重生物医学,收录地区主要是北美;而Embase是爱思维尔旗下的生物医药数据库平台,引文来源主要包括Embase和Medline数据库,覆盖学科方面偏重生物医学与药学,收录地区除北美外还大量包含了欧洲和亚洲;这两个数据检索平台虽各有侧重,但我根据他们共有的Medline数据库推测两个检索平台的来源期刊应该重合60%以上。而且二者基本囊括了生物医学领域的SCI文章,所以WOS可查可不查。
谷歌学术我就不多做介绍了,dddd,如果有人不会翻墙的话,国内也有大量的镜像网站可以使用。

刚才我们介绍了如何提高目标文献查全率,那么如何提高目标文献查准率呢?
根据我自己的经验,较高的查准离不开~(点),~(点),~(点),三者缺一不可
在此,我以Pubmed数据库为例,介绍如何做到这三点:
首先,想要在Pubmed使用准确的关键词的就要用到配套的Mesh词表(点击),爱思维尔旗下的Scope、Embase和EI等要使用配套的Emtree,在此就不多做介绍了。那么接下来我简要介绍一下MeSH词表(点击下一页)

~~~
《MeSH》在文献检索中的重要作用主要表现在两个方面:准确性(准确揭示文献内容的主题)和专指性(点击)
如果用这些关键词查阅中文文献可以使用Sinomed 的 CMeSH 词表(点击下一页)

MeSH 词表主要包含字顺表和树形结构两大部分。
字顺表按主题词、款目词、副主题词等;如果有同学想更加深入了解MeSH词表可以看下我共享的关于MeSH介绍的资料,在此我就不多做赘述了;
树形结构表按主题词的分类属性编排,它揭示了主题词之间的隶属关系和并列关系,有点像维基百科的树状词汇表(点击下一页)

使用MeSH词表可以使我们的关键词尽量准确,那么怎么做才能使我们的检索方式合适呢?(点击)
可以利用布尔逻辑和通配符来进行高级检索

~~~
Pubmed、知网等都是支持布尔逻辑运算符进行检索。很多时候我们不知不觉中使用的就是布尔逻辑,比如知网的一框式检索中所用的空格就是默认“AND
有两个需要注意的点:一是:使用逻辑运算符时需要采用大写字母。二是:如果一个检索式包含数个AND OR NOT,则可能出现运算次序的问题,可以使用英文括号( ) 来解决,运算时系统会先计算( )内问题,再依次外推。

刚才介绍过了三个布尔逻辑符,我再简单介绍一下通配符和引号的使用方法:首先,关键词是否加引号的区别就是,不加引号的话,Pubmed默认开启词汇自动转换功能,系统将按顺序使用MeSH转换表、刊名转换表、短语表和著者索引4种表或索引,对检索词进行转换后再检索。比如在pubmed中检索糖尿病 [ˌdaɪəˈbiːtiːz],不加引号,系统就会将相关近义词也列入搜索结果,使我们的搜索结果更为全面,提高查全率;如果关键词加引号,系统将关闭词汇自动转换功能,使搜索结果仅限于diabetes,提高查准率。
如果我们想纳入更多的词汇,PubMed 允许使用 * 号作为通配符进行截词检索。如:键入flavor*,系统会找到那些前一部分是flavor的单词(如flavored, flavorful, flavoring等),并对其分别进行检索
另外我们需要注意一点:刚才以上所用引号为英文双引号,不要搞错。

有了准确的关键词和合适的检索方式,基本可以满足咱们查准的需求了,但如果搜索结果数量较多,但阅读时间有限,这时候就需要优先选择水平较高的期刊来进行阅读,那么按照什么标准来判断期刊水平呢?(点击),我们可以参照分区和IF来挑选外文文献,按照是否是核心来选择中文文献?
中文为什么不讲影响因子呢?后面讲到国内期刊核心体系划分的时候再为大家揭晓。那我先为大家介绍下国外的期刊影响力评价体系(点击下一页)

~~~
期刊的IF能用来比较不同学科刊物水平的高低吗?答案是否定的,根据IF公式,不同领域的影响因子根本不可能横向比较,冷门学科顶刊的 IF 可能不如热门学科普刊的 IF 高,考虑到这一点,建立不同学科的分区制度很有必要。(点击)目前比较流行的分区制度主要有 JCR 分区和中科院分区。
JCR是指科睿唯安每年出版期刊引用报告,将收录的期刊分为176个不同学科类别,每个学科分类按照期刊的影响因子高低平均4等分(各25%),分别是Q1,Q2,Q3,Q4(这里的Q就是代表quarter,四分之一)。
中科院分区是中国科学院国家科学图书馆制定的。以前的基础版是将JCR中所有期刊以学科体系划分为13 大类,13大类期刊按照3年平均IF排名分为呈金字塔状分布的4 个区;一般来说国内更看重的是中科院分区,因为很多学校和科研单位只认可中科院分区。科研业绩奖励、职称评审等都按照中科院分区进行加加权计算。
另外,我想稍微补充一点题外话,科睿维安制定的 IF 和 JCR 分区制度虽然在期刊评价体系方面依旧很权威,但近几年质疑的声音约来越多,尤其是近几年疫情期间,大多数的SCI 期刊 IF 暴涨,严重动摇该评价体系的权威性,其实我们仔细看一下 IF 的计算方法就很容易发现 IF 就是一个除法的文字游戏:杂志只要减少发文量和增加被引用次数就能提高IF,比如让水刊集中大量引用、向大佬约稿、多发前沿综述、蹭热点,比如公布新冠数据等,真可谓漏洞百出。在这种情况下,国内外都有想破局者,其中国外的爱思维尔和国内的文献情报中心表现亮眼:全球最大的学术出版商爱思维尔基于自己全球最大的全文数据库推出了CiteScore(引用分数)这一期刊评价指标,近几年学术界一直在关注作为期刊影响因子最大竞争对手的CiteScore是否能够取代影响因子而重塑期刊水平等级划分;今年7月5日,中科院文献情报中心,宣告弃用影响因子,取而代之的是“期刊超越指数”。明年开始执行的的升级版则是以主题体系划分为18个大类,18个大类按照中科院国家图书馆制定的期刊超越指数来进行分区除了自然科学,还包括社会科学的文章
“一流企业做标准、二流企业做品牌、三流企业做产品”,我们不能总是被国外弄出来的一个SCI和IF给圈住,我们更要研究这些指标的内涵和他们的竞争者的优劣。希望不久的将来,由我们国人制定的学术指标也能被国际学术界广泛采用。
IF和分区既然如此重要,那我们该如何查询某个期刊的IF和分区呢?(点击下一页)

查询外文期刊影响因子,可使用外文数据库Web of Science中的JCR(Journal Citation Reports),但需要用大学代理账号。
查询期刊的中科院分区的话,可以使用微信公众号”中国科学院文献情报中心”或者小程序“IF查与投”等(点击下一页)

此外还有一些第三方网站也可以查询,~~或者MedReading
去复制粘贴还是很麻烦,那有没有直接显示的呢?答案也是有的(点击下一页)

以Pubmed和百度学术为例,标题后可直接显示杂志所属期刊的分区和 IF(点击) ,也可以利用左侧的筛选器来筛选(点击),
百度学术也是同理(点击)
讲完了外文期刊影响力评价标准-If和分区,那我再为大家介绍一下中文期刊的评价标准(点击下一页)

据知网统计,国内期刊大约12000余本,如此数目庞大的期刊数目,从学术水平来看自然要分三六九等。分等级就要有一套分级“标准”,这“标准”即核心期刊遴选体系,这个“标准”国内有好几种,~~~~那他们之间有什么区别呢?(点击下一页)

国内核心期刊主要有以下几个核心:
南大核心:南京大学中国社会科学研究评价中心,组织评定的《社会科学引文索引》(Chinese Social Sciences Citation Index,CSSCI)来源期刊”,即“南大核心”或称“南核”;有些地方会将其简称为“C刊”,注意不是“C类期刊”哦,每2年遴选一次;(全国绝大多数高校、医院、研究院所认可)。该目录包含来源版及扩展版两个目录。从影响力来讲,其等级属同类划分中,国内最权威的一种,入选难度高于北大核心。
中国科学院文献情报中心《中国科学引文数据库》(Chinese Science Citation Database,CSCD),分为核心库和扩展库两部分,被誉为“中国的SCI ”每2年遴选一次;(中科院、少量高校认可)。
北大核心:北京大学图书馆“中文核心期刊”,即我们通常说的“北大核心”或称“北核”;是北京大学图书馆联合众多学术界权威专家鉴定,国内几所大学的图书馆根据期刊的引文率、转载率、文摘率等指标确定的。目前受到了学术界的广泛认同。
每3年遴选一次;(全国绝大多数高校、医院、研究院所认可)。
科技核心,全称为“中国科技论文统计源期刊” ,亦称中国科技核心期刊或统计源核心)。受国家科技部委托中国科技信息研究所建立了中国科技论文与引文数据库(CSTPCD),受到社会各界的普遍重视和广泛好评。
虽然国内核心期刊有三大核心、七大核心等说法,但国内各大高校主要还是看~~~三个核心,别的核心标准稍作了解即可。
对于国内各个核心的划分,我觉得有点像显示器不同色域的标准一样,(点击)我相信各位在购买显示器的时候经常会发现显示器的商品界面都有写着这个显示器是多少多少色域的,有99%sRGB的,有99%Adobe RGB的等等,色度图中三角形区域面积代表能覆盖的色彩范围,s RGB、Adobe RGB等色域标准虽各有侧重,但核心区域是几乎一致的,这就跟北核、南核、CSCD等收录的期刊虽各有侧重,但公认的优秀期刊均会被收录,这一点和显示器不同色域标准有异曲同工之妙。
中文为什么不讲影响因子呢?因为很尴尬,大部分中文期刊里的核心期刊,IF普遍只有一点几分,因此中核的IF不提也罢。

此外,我简要介绍一下上一页出现的各核心概念:
A类期刊、B类期刊、C类期刊是各高校和科研院所对期刊级别的一种分类。事实上,各个学校通常有自己的A/B/C类期刊的分类,用于本校的评奖评优。通常在质量上来说,A类 > B类 > C类。
国家级期刊与省级期刊并无明文规定!!! 国家从来没有对刊物做过级别之分,仅主办方不同
(点击下一页)


我们可以使用顺藤摸瓜法,一次搜尽相关文献,如果用这种方法的话,我比较推荐的是research rabbit 和 connected papers ,首先为大家介绍一下~

下面我以过滤器Vmax实验文章为例为大家演示下 Reach Rabbit的使用:(点击)
打开网址-添加文献-输入DOI号-单篇文献中我们还可以看到“相似工作”(Similar Work)、“所有参考文献”(All References )、“所有引文”(All Citations)、“相同作者”(These Authors)和“推荐作者”(Suggested Authors),就可以将相似文献一网打尽。

那么下面我再介绍一下 connected papers.
Connected Papers 的呈现方式有点像网络药理学中的 PPI 分析,呈现一个可视化的相关文献网络图,每个小球代表一篇文献,最中间黑色边框的小球就是本文章;根据右下方年份分布图标可以看到,小球的颜色越深代表时间越近;球的大小与被引用次数有关,小球越大表示被引用次数越多;小球之间的线条表示引用关系,相似的文章会距离较近或中间有强的连线;用光标移到小球上时,右侧边栏会出现该篇文献对应的文献信息。

这两种方法在输入咱们想要查阅的文献之后,就会呈现一个可视化的相关文献网络图,从而使得原本一排排罗列着的参考文文献呈现图像化。这个可视化的相关文献网络图列举的都是与咱们所检索的研究领域最相关以及最重要的文献,帮助咱们快速筛选出要了解的背景知识和相关文献,防止我们迷失在文献的汪洋大海中。
所有这些相关信息,对于我们通过重要文献,围绕相似工作,进行深度的文献追踪和分析极为方便。这些链接让原本单一的文章成为网络,也让我们的文献检索工作更为系统和全面。(点击下一页)

介绍完了如何提高我们文献检索的查全率和查准率,下面我再为大家简要介绍一下文献下载的方法。
根据我前边对于各类文献库的介绍,我们下载文献应该选用哪类数据库呢?
没错,就是全文数据库!
由于这三大全文数据库均需付费,如果自己有账号的话可以挂学校VPN来下载原文,没有账号的话可以在TB买一个或者借朋友的,
也有免费下载的方法,(点击)比如iDate和各省公共图书馆的电子资源服务,
其中,iData是由北大、清华、浙大、复旦等师生学者共同筹建的用于教学、科研目的的公益互联网项目,简单说这就是个盗版知网,知网收录的文章基本都可以在这下到。
各省图书馆中我用的比较方便的是浙江省图书馆,非常方便,只需要用支付宝账号办一个读者证,就可以免费下载知网维普万方独秀超星等数据库文献原文。

大家在下载英文文献原文时用的肯定是SCI-HUB,SCI-HUB虽然可以下载99%以上的文献,但最近一两年的文章还是不能下,SCI-HUB拥有巨多的网站域名像.se、.st、.ru等,只用一个域名不就好了,而且有的域名隔三岔五404,我们还要去寻找新域名,大家有没有想过这个网站为什么会有这么多域名?
答案就是这是个盗版网站,前边提到的那些学术出版商的数据库下载一般要几百块钱一篇,有位美女认为:期刊付费墙阻碍了科研的进步,让学术交流变得更封闭、更低效。,于是一位88年的哈萨克斯坦籍计算机研究生于2011年返回哈萨克斯坦后创建了Sci-Hub,可以免费下载各大出版商的学术论文,但这严重侵害了爱思维尔等学术出版商巨头的利益,她被爱思唯尔等出版商在各国法院起诉,为了逃避引渡的风险,四处躲藏。所以这个网站的网址就会经常变动,像打游击一样,过一段时间换个域名。
“可敬的利他主义抑或大型犯罪组织,大家认为这位美女是前者还是后者呢?
手动尝试可用域名费时费力,那有没有稳定的桌面版本呢?有的!(点击),像这种桌面版的文献神器也挺方便。

桌面版虽好,但是还要复制粘贴一下,我还是觉得麻烦,那有没有不用复制粘贴,只需要在文章标题后点一下就下载好的工具呢?
答案也是有的,这个功能无论是插件还是油猴脚本都可以做到!
补充一点,大家如果看知网硕博士论文有没有被知网的CAJ格式恶心到,这个插件可以在知网下载PDF格式的学位论文,我觉得还是蛮方便的。

如果SCI-HUB没有收录的就只能进行文献求助了,可以利用谷粉学术论坛、科研通、Scihub mutual aid等(科研通一直说谷粉学术抄袭他)。也可以利用各高校图书馆文献互助群等
也如果还不能找到,那我建议干脆换一篇文献看吧

在进行文献管理方面的工具分享之前,我想和大家聊一下,就是“我们为什么要进行文献管理?
”看过文献后把当时的技术问题解决了不就行了,为什么要花时间来进行文献管理呢?
在回答这个问题之前,让我们先了解一下什么叫“文献管理”(点击下一页)

文献管理是2019年公布的图书馆·情报与文献学名词,指的是~
科研工作中不知道你们有没有遇到如下几种问题(点击),~~~~
之所以会出现这些问题,就是他们在收集、积累文献一开始,没有意识到文献管理的必要性,文献存储不科学,最终导致检索困难,利用困难。
文献管理的目的不是为了写笔记,是为了需要用的时候瞬间能够用到,比如写标书立项和学术文章,标书和学术论文不同于其他文体一个最显著的特点就是它们有参考文献体系的支撑:所有的讨论都要基于前人的发现,参考文献事实上经常是考察作者知识面的关键,对前人工作的遗漏会严重降低实验设计和文章的系统性与创新性。另外的使用就是进行学术报告和学术交流的场景,如果你能做到在大脑或笔记中快速定位到一个观点或现象然后几句话说清楚,交流起来就会更加高效和有底气(侯哥和倍宁经常出差,这一点应该体会更深)
科研工作,从某种意义上来说,其实就是跟文献打交道的过程,这个过程中,对文献的管理是一个比较重要的环节,顺手整理的过程可能会花费我们一点时间,但随着阅读文献数量上的增加,管理的价值就逐渐体现出来了
通过刚才的了解,我们也认识到了进行文献管理的必要性,那么我们该如何进行文献管理呢?我的习惯是利用NE等文献管理软件进行文献管理。

那文献管理软件能够带给我们哪些便利性呢?于我而言,首先,它可以~(点击)
1. 帮助构建知识体系
如果只用windows的资源管理器,文件夹套文件夹,一层又一层,数量够多时,花在思考“该把这篇文献扔在哪呢?”比阅读文献的时间还长。
而且,对于涉及话题较多,维度多,信息量大的文献咋办?你很难把它限定在某一个子类下边
一维的、线性的文件夹式存储会直接限制一篇文献能给你带来的价值,因为你在分类的时候就已经下意识的把它切割、打磨,以便塞到你的分类体系中了。
如何尽可能完全地榨取一篇文献的价值才是文献管理的最终目的。(点击)
2. 插入自动排序且格式规范的参考文献(这种方便谁用谁知道)
3. 便于传承与共享(一个人的时间精力是有限的,文献共享便于团队后续研究者有时间精力更上一层楼)

各文献管理软件各有优劣,但我们只要掌握一两个文献管理软件就足以满足日常的文献管理需求。
我见过一些小伙伴即使没有使用文献管理软件,
希望大家不要掉到工具选择的坑里,重要的是要构建完整的知识管理体系,哪怕是基于便签的只要能实现头脑知识的更新换代就可以了
感兴趣的话,下载下来自己研究一下,
Mendeley。2013年抱到了Elsevier的大腿,基本的功能是都有的,可以尝试,但是我觉得没什么亮点。
Endnote:Endnote大家都知道的,功能最全,最老牌,背靠汤森路透这棵大树,乘凉很容易啊。这三者都是收费的,而且价格“都对得起出身”~
Zotero。我没有尝试过,只是简略的看过,貌似主要是浏览器插件式的管理方式,对于在线发现、收集文献应该很方便。
以上的软件貌似都有一个问题:对中文文献支持很差(除了土豪Endnote做的稍微好一点儿)。当然,如果你基本不读中文文献,无妨。
如果中英文文献都读的话,那我建议~~~

国内众多高校的图书馆推荐文献管理软件很多也是首推NE,
NE在文献管理领域的江湖地位有众多高校图书馆背书,也就不用我再多做赘述了吧?

以下是NE的使用方法:首先~~


题录指检检索类刊物中描述文献外部特征(题名、著者、出处等) 的条目









接下来是交流时间,大家可以和我交流下~方面的相关知识,我也想了解一下大家了解新领域的文献检索习惯和所用数据库;有没有比较好用的文献方面的神器?
