浅谈如何阅读论文paper?(二)
上一篇文章我们从如何选择论文 、查找论文的几个常用网址 、如何筛选优质论文 、如何精确查找已知论文这4个角度给了大家一些方法。
(上篇文章请戳👉 https://www.bilibili.com/read/cv6310869)
那这一篇,我们从以下3个角度给大家一些方法:
1、如何管理论文
2、如何阅读一篇论文
3、论文paper学习路径

第一点,如何管理论文?
我们学习的论文太多,所以需要进行论文的管理:
1、PDF格式论文通过命名进行管理。推荐两种命名格式:
时间-作者-题名的方式,
或者时间-关键词-题名的方式。
将同一个作者的同一个研究进行归类,可以清晰的看出这个研究的发展。
除了规范的命名,我们还需要将同类的论文放到同一个文件夹中,方便我们查找。
2、论文管理软件:
如果涉及成百上千的论文管理,那么推荐使用论文管理软件。
常用的有endnote,mendeley,Zotero等等,大家可以根据需要自行下载安装管理软件。
【这里提醒大家,endnote是收费的,mendeley是免费的,下面就是mendeley的界面,我们可以看到它可以很好的管理大量的论文。】
第二点, 如何阅读一篇论文?【敲重点~
首先,不同的人看论文侧重点不同,
刚入门的学员,这一类同学主要目的是学习论文中的知识点,所以要求面面俱到,尽量每个细枝末节都要学。
对于工业界中的工程师,则需要注重算法实现部分,要快速的从论文中知道如何复现算法,应用到自己的项目当中。
那么推荐的论文阅读方法是分为三步,首先 泛读,再精读,最后总结。
这里泛读的作用就是快速浏览,把握概要,如同吃火锅一样,一大桌菜,我们先看看桌上有哪些菜,哪些菜是要吃的,哪些是不吃的。比如,火锅底料我们就是不吃的啦~
泛读阶段,我们重点读标题、摘要、结论以及所有的小标题和图标。
下面我们举个例子,对论文进行快速浏览,

这是一篇CV领域非常经典的论文Alexnet,我们先看题目,题目是Imagenet classification with deep convolutional neural networks,从题目我们知道这论文用深度卷积神经网络来做图像分类任务。
接着阅读摘要,我们可以了解论文的概要,清楚论文采用什么方法,解决什么问题,达到什么效果。接着我们要把论文所有的小标题给列出来,将论文大卸八块,了解论文都有哪些内容,就像前面那一桌子火锅,我们要先浏览每一个盘子里装的是什么菜。
接着还要把论文的结论,所有的图片和表格进行浏览,更近一步了解论文中有哪些论证,举例,内容说明。
通过以上几个步骤,这时对论文有了一个大概的认识。在泛读之后,我们要达到的水平就是能回答以下这三个问题,这样才能算泛读完成。
第一问题,论文要解决什么问题? 回想摘要我们就知道它是像要解决ILSVRC挑战赛中的分类任务。
第二个问题,论文采用了什么方法?那么这篇论文采用了什么方法呢? 其实在题目中就告诉我们了,采用的是深度卷积神经网络。
第三个问题,论文达到什么效果?从摘要我们也能知道,论文在ILSVRC2012比赛中以15.3%的top5 error夺冠
这就是对泛读之后进行自我评测的三个问题。
泛读完成之后,对论文总体有了把握,接下来就是挑选精华部分进行阅读。
这一部分就是仁者见仁,智者见智的地方了,还是和吃火锅一个道理,满桌子的菜,你要找到哪个是你需要吃的,哪些是不需要吃的。前面提到在校生与工程师读论文之间是有差异的,更具体地就体现在精读部分。对于学员来说,要学习更多知识,做到面面俱到,那么论文中的所有内容都是你的精华,都需要仔细阅读,仔细去品。对于工程师而言,目标就是找到算法实施部分,了解算法如何实现,以及其中有哪些技巧,更偏工程的看待论文。对于精读完成后,我们要能够对所读段落了如指掌。这样才算完成精读。
经过泛读精读,最后需要对论文进行总结。
总结是对论文的创新点、关键点和启发点进行摘抄记录。
对于有写论文发论文需要的同学来说,这一步是至关重要的,对论文的总结是为课题提出创新点打下基础。
总结部分也是仁者见仁,在校生需要总结一切与写论文发论文有关的信息句子,对于工程师,可能更多的是总结算法实现的参数,步骤,实验细节等
完成论文三步曲之后,我们需要对阅读效果进行一个验证。
验证的方法其实很简单,就是回答三个终极问题,你是谁,从哪里来,到哪里去
最后也要知道这篇论文有哪些是可以借鉴的。
最后,我们来看看论文结构,要知道论文都有哪些内容构成,每一部分会有什么信息。
这里总结为6个主要部分。
1.摘要,摘要主要讲论文简介,阐述工作内容,创新点,效果
2. 引言部分介绍研究背景,研究意义,发展历程,提出问题
3. 相关工作相关研究算法简介,分析存在的缺点
4. 本文工作论文主要方法,实现细节
5. 实验部分,介绍算法实现步骤及结果分析
6. 探讨部分,论文结论及未来可研究方向
第三点,如何更高效地阅读论文,并通过论文熟悉某个方向领域呢?
学习论文是一个系统性的工程,如何更高效地阅读论文,并通过论文熟悉某个方向领域呢?这就需要合理的学习路径。
第一点,基础必不可少。
这里总结了必备的基础知识,我们来看一下。
1、Python基础,这是毋庸置疑的必备基础,我们后边代码实现就是基于python语言。
2、数学基础,包含矩阵计算、概率论和信息论,矩阵计算在CV领域是必备知识,概率论与信息论在NLP中也是常见的概念。
3、神经网络基础,由于深度学习属于神经网络,因此神经网络的内容必须要了解,特别地,对于CV领域CNN是很重要的,大多数CV任务已经被CNN统治,对于NLP领域而言,RNN是必不可少的知识。
4、除了理论基础,实践的基础就是现在最热门的深度学习框架PyTorch,我们需要了解如何利用pytorch实现数据读取,数据增强,如何构建模型,如何设置损失函数优化器等等。
那为什么选择Pytorch呢?因为PyTorch是现在最适合新手入门的框架,代码简洁易读懂,并且目前最前沿的技术,论文,大多数都有pytorch的实现,学会pytorch可以快速的紧跟前沿技术。
有了理论和实践的基础,就要针对CV和NLP两个方向进行选择,CV和NLP有着各自领域基础,大家要根据自己方向进行基础知识的巩固学习。
对于CV领域,我们需要知道图像基础知识,图像的基本处理方法等等内容
对于NLP方向,我们需要了解什么是词袋,分布特征是什么,tfidf权重,等基础知识。
那我们巩固好理论、实践、方向领域上的基础之后,就可以进入论文的baseline
cv方向,你应该选择领域内引用高,同行间普遍熟知的论文,包含alexnet vggnet googlenet resnet等等。
NLP方向的baseline,你应该选择开创性、引用高和应用到实际业务的论文,主要覆盖词向量、nlp深度学习主流框架和应用,预训练模型等主流方向,做到兼顾科研和工业应用平衡。
熟悉了baseline论文,就算是入了门,接着就可以根据自己研究方向及感兴趣的方向选择性的学习专题论文。
对于CV常见的有OCR、GAN、知识蒸馏、目标检测、图像分割等等。
对于NLP有文本分类,句子匹配,关系抽取等等。
从中找到你想要研究的专题是很重要的,如果你在初期阶段,对细分专题没什么概念,你也可以初步都学习了解一下,找到自己感兴趣的专题,针对特定研究方向,深入学习。
学习之路虽然不易,但我们还是可以在学习中总结经验。
希望这些能给大家提供一些帮助。

《浅谈如何阅读论文paper》系列的文章,
来自于深度之眼 “paper论文会员班”的课程视频——《效率提升3倍的Paper 阅读方法》
关于 “paper论文会员班” 的详细信息,
请戳👉 https://mp.weixin.qq.com/s/pOeTjOJeTdNp8x4e2yB53w