CVPR 2022新星有话说 | 李峰 & 张浩的“无痛”论文写作技巧

「Paper新星有话说」正式上线辣!这是来自ReadPaper的新栏目,我们邀请了一批CVPR 2022 Oral论文年轻作者,听酷盖们聊聊他们的科研成果和心得,还有独家科研小Tips分享哦;
首期Paper新星是来自我们IDEA研究院计算机视觉与机器人研究中心(IDEA Research CVR)的两位研究实习生:李峰 & 张浩。


由李峰、张浩共同一作的《DN-DETR: Accelerate DETR Training by Introducing Query DeNoising》被CVPR 2022接收为Oral论文,并斩获了112的高分。

论文写作需要警惕哪些“坑”?遭遇科研“瓶颈期”该如何克服?本期两位Paper新星将和我们讲述科研论文之路,并分享论文“无痛”写作小tips。
论文标题:
DN-DETR: Accelerate DETR Training by Introducing Query DeNoising
论文链接:
https://readpaper.com/paper/4597309026329436161

Q1:关于个人论文发布成果,觉得最具代表性的一篇是?为什么会选这篇?
《DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection》
李峰:我们在这篇工作里面取得了COCO目标检测的第一名,体现了新一代检测器DETR优异的检测性能和可扩展性。
张浩:这篇是DETR like模型首次取得SOTA的表现,说明DETR like模型具有不次于convolution based模型的能力。
Q2:过往的学习/工作经历中,是否有某件事情对自己的学习领域或者就业方向有决定性的影响?
李峰:来到香港科大跟着沈老师和倪老师读博士。两位老师对科学研究有着高瞻远瞩的洞察力,教会了我很多关于科研的方法论和科研品味,以及对待论文写作和实验的严谨性。同时,组里自由的研究氛围让我得以探索自己喜欢的研究领域。
张浩:有一次听到《沈老师带你读论文》节目中沈老师跟胡瀚老师聊到做研究的格局,说到“你可以选择不去做什么样的研究”,有的研究问题想想都知道很trivial,就算做出来影响力也很有限,这时候可以选择不去做,而把时间留给更有价值的问题。
Q3:哪些或者哪位科学家、学术大拿对自己的启发/影响最大?
李峰:IDEA 计算机视觉与机器人的张老师。张老师已然一位成功的科学家,但不仅对各个领域都有深刻的认识,而且还处在科研一线,对很多问题的细节和代码也十分了解。因此,张老师不仅能引导学术方向,而且常常能给我们非常细致的指导。
张浩:IDEA研究院的张磊老师对我影响很大,他会很注重研究方向的把握,是我做研究的领航员。而且张老师有非常丰富的工程经验,在我们实验受阻的时候总是能提出很有帮助的提示。
Q4:对于打算或者在读博的同学们,有什么心得可以分享?
李峰:-谨防掉入这些坑:从我看来,第一波坑就是不够专注,走马观花。刚开始进行科研的时候往往涉猎广泛,难以找到一个有价值的问题,并持之以恒地深入研究下去,浪费了很多时间;
-如何克服科研瓶颈期:从我的经验来看,这种时候科研多跟老师和同学交流,从他们那儿得到一些反馈或者灵感。同时应该静下心来思考问题,多阅读一些论文进行探索。如果实在搞不定,不如先放下这个问题,把它记在心里,先去做其他问题,说不定某一天就有解决的方法了。
张浩:-谨防掉入这些坑:谨防一直埋头做实验,好的选题也很重要;
-如何克服科研瓶颈期:一定要多和导师同学交流,回顾我的研究过程,大多数困难都是在与别人交流时找到的解决方法。
还有做实验的时候要细心,结果不符合预期的时候要仔细观察loss或者可视化结果来找出问题的原因,不要对所有idea都浅尝辄止,很多时候不是idea不work,而是实现idea的过程有问题有bug。

Q5:尝试用一句话评价自己本次被CVPR收录的工作?
李峰:DN-DETR是一种新的训练方式来加速DETR类型的模型,即插即用,并对收敛速度和结果带来显著提升。
张浩:是一种无痛长点的训练方式,可以用于所有DETR like目标检测方法,使得收敛时间减半,即插即用很方便。
Q6:整个投稿的过程中,有没有印象深刻的经历?
李峰:印象深刻的是这个题目的研究过程。最开始的灵感其实是来源于自然语言的预训练模型,但是早期遇到了很多的问题,通过一步步的改进和讨论才有了现在的DN-DETR。因此,广读论文是很有帮助的,其他领域的文章也能带来启发。
张浩:印象最深的是有一位审稿人对我们的工作评价很高,给了我很大的鼓励,提高了我后来做研究的信心。
Q7:关于无痛论文写作,有什么tips可以分享?
李峰:我一般会多读一些经典论文,同时把论文里面的一些比较地道的语句摘抄下来,自己写的时候也可以用上。写完论文后,可以多检查一下,或者用一些专业的英文语法检查软件进一步检查一下。
张浩:关于论文写作,要有好的故事线,要把如何发现问题,分析问题,解决问题的过程写清楚。要多练习,仿写。还有就是要找个有经验的人帮忙改论文。

Q8:近期是否有新的工作/投稿在推进?投稿?
李峰:是的,我们最近沿着DETR类型的模型做了一系列工作,目前已经在目标检测、实例分割、全景分割、语义分割等多个领域拿到了第一名。
张浩:最近在修补之前的工作上的一些不完善的地方。
Q9:能否分享下个人长期规划?
李峰:希望能够在感兴趣的领域深耕,做出更有影响力的工作。
张浩:希望可以从事喜欢的研究,如果能够落地就更好了。
Q10:请畅想一下,你的工作将会给行业、社会带来什么贡献/力量?
李峰:希望能够DN-DETR提出的问题和解决方案有一定价值,能启发领域的研究人员做出更好的检测器。
张浩:不敢说能带来什么贡献,希望能给同行的研究者提供一些解决问题的思路。