【论文复现代码数据集见置顶评论】3小时高效复现CV计算机视觉经典论文!论文精讲&

读什么论文

如何找论文
(知网,找优质综述快速入门)
百度学术、google scholar
arXiv

如何找论文
PMID(PubMed Unique Identifier,PubMed唯一标识码):PubMed搜索引擎中收录的生命科学和医学等领域的文献编号
DOI(Digit Object Unique Identifier,数字对象唯一标识符),相当于文献的数字身份证

如何整理论文
时间-作者-题名
时间-关键词-题名

论文管理软件,endnote,Mendeley,

读论文的困境

不同人群阅读差异

读论文三部曲、泛读、精读、总结


回答问题

可借鉴地方总结

论文结构

论文代码学习:任务定义-数据来源-运行环境-运行结果-如何实现

基础知识

baseline
CV\NLP

细分专题

学习路径

本篇论文
《ImageNet Classification with Deep Convolutional Neural Network》

前期知识储备

论文总览

学习目标:卷积核可视化、模型结构设计、ILSVRC(数据集)
减轻过拟合

研究背景

ILSVRC:大规模图像识别挑战赛


强大计算资源——GPU

研究背景、成果及意义
研究成果

研究意义:拉开卷积神经网络统治计算机视觉的序幕,加速计算机视觉应用落地
端到端实现


安防领域的人脸识别、行人检测、智能视频分析、行人跟踪

论文结构

摘要


AlexNet结构


卷积输出特征图大小计算

连接数量计算公式

AlexNet结构特点

ReLU非线性


LRN:局部响应标准化


训练技巧:减少过拟合

数据增强



Dropout

实验结果及分析



卷积可视化

可用Alexnet提取高级特征进行图像检索,图像聚类

论文总结

关键点:
- 大量带标签数据——ImageNet
- 高性能计算资源——GPU
- 合理算法模型——深度卷积神经网络
创新点:
- 采用ReLU加快大型神经网络训练
- 采用LRU提升大型网络泛化能力
- 采用Overlapping Pooling提升指标
- 采用随机裁剪翻转及色彩扰动增加数据多样性
- 采用Dropout减轻过拟合
启发点

