欢迎光临散文网 会员登陆 & 注册

如何写一篇合格的NLP论文?

2022-08-22 14:36 作者:沃恩智慧  | 我要投稿

NLP 是一门重视实践和应用的领域,创新成果可以是新的算法、任务、应用、数据、发现等,它的影响力则取决于它对该领域发展的推动作用。而学术论文的作用是,向学术界同行清晰准确地描述成果的创新点、技术思路、算法细节和验证结果。

那么一篇合格的NLP论文到底长啥样?每个部分具体应该怎么写呢?

看这一篇文章就够了。

01一篇 NLP 论文的典型结构

NLP 学术会议(甚至包括期刊)论文已经形成比较固定的结构。绝大部分论文由以下六大部分构成:摘要(Abstract)、介绍(Introduction)、相关工作(Related Work)、方法(Method)、实验(Experiment)、结论(Conclusion)。少数论文会根据创新成果形式不同而略有不同,例如提出新数据集的论文,可能会把 Method 部分调整为 Dataset 的标注与分析,但不影响论文整体构成。每个部分作用不同:

摘要:用 100-200 词简介研究任务与挑战、解决思路与方法、实验效果与结论。


介绍:用 1 页左右篇幅,比摘要更详细地介绍研究任务、已有方法、主要挑战、解决思路、具体方法、实验结果。


相关工作:用 0.5-1 页左右篇幅介绍研究任务的相关工作,说明本文工作与已有工作的异同。


方法:用 2-3 页篇幅介绍本文提出的方法模型细节。


实验:用 2-3 页篇幅介绍验证本文方法有效性的实验设置、数据集合、实验结果、分析讨论等。


结论:简单总结本文主要工作,展望未来研究方向。

乍看这样每篇论文显得死板,实际上这正凸显了学术论文的真正意义,不追求在形式上给读者带来意外,而将读者注意力集中在论文介绍的研究成果上。

此外,在写学术论文的时候,很多同学总会走入一些误区。因此下面这两点务必要注意。否则很容易遭到退稿。

02论文作者要关注的点

一、学会换位思考。要始终站在审稿人或读者的角度审视论文,思考如何更清晰地表达。

二、注意逻辑严谨。严谨是学术论文的底色,从引用格式、公式符号到谋章造句,都力求风格统一,行文严谨。

章节层面,Introduciton 提到已有方法面临的几个挑战,就要对应本文提出的几个创新思路,对应 Method 中的几个具体算法,对应 Experiment 中的几个实验验证。

段落和句子层面,段间要注意照应,是并列、递进、转折还是总分关系,需要前期规划好,要有相应句子或副词衔接。段内各句,有总有分,中心思想句和围绕论述句分工协作。

03Abstract 和 Introduction 怎么写

Abstract和 Introduction 作为论文开篇的两部分,是读者对你这篇论文的第一印象,同时,很多审稿人也会先通过论文摘要和简介来先对论文做一个初步的评判。

Abstract 可以看做对 Introduction 的提要,Introduction 是对整个工作的全面介绍,是决定一篇论文能否被录用的关键。一般 Introduction 这么写:起手介绍研究任务和意义;随后简介面向这个任务的已有方法;接着说明已有方法面临的关键挑战;针对这些挑战,本文提出什么创新思路和具体方法;最后介绍实验结果证明本文提出方法的有效性。这几个部分各挡一面,同时又有严密的内在逻辑。每个部分也各有章法,下面分别介绍对各部分的建议:

(1)研究任务。介绍本文的研究任务及其在该研究领域的重要价值和意义。如果是领域公认的重要任务的话,则可以不用详细论述其研究价值/意义;如果是新提出的研究任务,则需要花费比较多篇幅说明该任务的价值。

(2)已有方法。从研究任务递进一步,介绍这个任务的已有代表方法。需要注意,这个已有方法需要是目前最好、最具代表性的,也是本文工作准备改进的。所谓站在巨人的肩膀上,一篇值得发表的论文需要找到那个最高的巨人。 

(3)面临挑战。已有方法一定仍然存在某些不足或挑战,才需要进一步研究改进。因此,需要总结已有方法面临的挑战。这是 Introduction 的关键部分,起着承上启下的作用。

(4)创新思路。既然已有方法有这些不足和挑战,就需要有新的创新思路和方法。这部分需要注意与上面的挑战部分相互呼应,让读者清楚领会到这些创新思路与方法的确能够解决或缓解这些挑战问题。

(5)实验结论。除了在创新思路部分图文两开花地说明本文创新工作外,还要通过合理的实验验证方法的有效性。

对于 Abstract,可以看做对 Introduction 的简介,最简单的做法是,以上每部分都精简为 1-2 句话组成 Abstract 皆可。

04Method 怎么写

这部分要详细介绍本文创新方法的具体细节,由于涉及非常艰涩的细节,要采用总-分结构来介绍。

这部分起手“总”的部分要介绍本文任务的符号定义,以及本文方法的框架组成,或者按步骤来介绍或者按模块来写,让读者对本文方法有全景式的理解。

然后进入“分”的部分,则需对应「总」中的框架,分别介绍各关键模块/步骤。读者在“总”的部分已经对方法有全景式的了解,有的放矢,就比较容易理解每个模块的具体细节。而每个“分”的部分中,又可以进一步采用“总-分”结构进行介绍。为了更清晰地体现“总-分”结构,可以将各“分”的部分命名并加粗。

05Experiment 怎么写

这部分要详细介绍与实验相关的具体细节。一般先介绍实验数据、评测标准和比较方法等基本信息。

在介绍完实验基本信息后,主要开展两种实验:

(1)主实验。目的是证明本文方法与已有方法相比的有效性。一般需要选取业界公认的数据集合或已有工作采用的实验验证方式,提升实验的可信性。对于学术论文而言,并不需要比该任务上最好的方法相比,只要证明采用本文创新方法与不采用本文方法相比更有效即可。

(2)辅助实验。目的是展示本文创新方法的优势和特点。例如,不同超参数对本文方法的影响(Hyper-Parameter Effect),不同模块对本文方法效果的贡献(Ablation Test),不同数据划分对本文方法的影响(如 Few-shot Learning 相关工作比较常见),本文方法的主要错误类型(Error Analysis),本文方法能够改进效果的典型样例(Case Study)等。

Experiment 部分的特点是要图文并茂,注重通过多个表格和图示来呈现本文方法的优势和特点,需要注意图表风格统一。初学者特别注意,要做到仅凭图表下方的说明文字就可以理解每张图表内容,不要让读者还要到跑到正文寻找相关说明。因为,很多有经验的审稿人在看完 Introduction 后,会直接跳到 Experiment 图表中寻找对比效果。

06Related Work 怎么写

这部分主要是介绍本文任务和方法的相关工作,目标是通过对已有工作的梳理,凸显本文工作的创新价值。对已有工作的梳理,不应是对每个工作的简单介绍,而应当注意汇总、分类、分析,或者按照时间发展顺序,或者按照技术路线划分。

在对相关工作的介绍中,要注意暗合本文创新思路要解决的挑战,不应是单纯的介绍,而是夹叙夹议,时刻注意与本文工作的照应。在 Related Work 的最后,应该落脚到本文工作与已有工作相比,有什么新的思路,解决了什么挑战问题。

Related Work 一般放在 Introduction 之后,或者 Conclusion 之前,这一般取决于论文工作的特点,一般建议 Related Work 放在 Method、Experiment 之后即可。这点并无成法,完全根据行文方便来定。 

07Conclusion 怎么写

在论文最后会有总结展望,一般用一段来再次总结和强调本文的创新思路和实验结果,然后说明未来建议的研究方向和开放问题。这部分相对来讲比较固定。稍微留意的是,在准备论文最后阶段,如果发现论文有哪些应当做还没来得及做的,可以写作本文的未来工作。至少可以向审稿人表明你也想到这个问题了,赢得一点同情分。 


——————分割线——————

一篇好的论文到底长啥样?

会有无数的人告诉你一二三四五点,但是一定都离不开论文的价值。

最近也也咨询了一位KDD、ACL顶会的PC委员、审稿人,他的意见是,

发文最核心的一点,就是你的研究有没有做出贡献。

下周8月24、25日,

沃恩智慧特邀请NLP领域顶会PC委员、审稿人亲自带读最新论文,

详解一篇NLP论文的idea从何而来?

私信获取听课链接

免费进公开课群交流

如何写一篇合格的NLP论文?的评论 (共 条)

分享到微博请遵守国家法律