自然语言处理 绪论习题
问题1:NLP的定义是什么?
自然语言处理(Natureal Language Processing,NLP)是研究利用计算机技术对语言文本(句子、篇章或话语等)进行处理和加工的一门学科,研究内容包括对词法、句法、语义和语用等信息的识别、分类、提取、转换和生成等各种处理方法和实现技术。--------《计算机科学技术百科全书》宗成庆
也就是利用计算机模拟人的语言智能。
问题2:自然语言与人工语言的区别是什么?
自然语言是自然形成的人类语言,例如汉语,英语。人工语言是人类设计出的语言系统,例如C语言,Python语言。
问题3:NLP经历的三个阶段是什么?
①理性主义:符号逻辑。1947年到1990年,特点为 规则、词典加上算法。
②经验主义:统计学习。1990年到2013年左右,特点为 语料、特征加上模型。
③连结主义:神经网络。特点为 语料➕模型,在神级网络大火后发展起来。
问题4:NLP的困难和挑战是什么?
五个基本问题:①形态学问题②句法问题③语义问题④语用学问题⑤语言学问题
两大主要困难:①大量歧义现象:a.语法歧义(分词) b.词性歧义 c.结构歧义 d.语义歧义 e.语音歧义
②大量未知语言现象: a.新词 b.新含义 c.新用法和新句型