欢迎光临散文网 会员登陆 & 注册

考研杂谈 | 是什么让深度学习与众不同?

2021-04-29 08:29 作者:苏世考研  | 我要投稿


苏世计算机考研,程序猿专属的学习分享社区


/ 写在前面的话 /

考研杂谈,考研过来人和你聊考研。


在当前的 人工智能(AI)媒体风暴中,深度学习的炒作尤其强劲,几乎人人都知道深度学习这个概念。


首先,深度学习不是AI甚至机器学习的代名词。人工智能是一个广泛的领域,旨在“自动化认知过程”。机器学习不过是是AI的一个子领域,旨在纯粹从接触训练数据开始自动开发程序(称为模型)。而深度学习是机器学习的众多分支之一,其中模型是几何函数的长链,一个接一个地应用以形成层次结构的堆栈。它是机器学习的许多方法之一。



是什么让深度学习与众不同?为什么深度学习在机器学习技术之间特别耀眼?深度学习在许多任务上都取得了巨大的成功,这些任务历来对计算机来说是极其困难的,特别是在机器感知领域,包括从图像,视频,声音等中提取有用的信息。



如果有足够的训练数据(特别是由人适当标记的训练数据),则有可能从感知数据中提取出人类可以提取的几乎所有内容。互联网大厂利用深度学习开发相当于人类级别的语音识别,智能助手,人类级别的图像分类,大幅改进的机器翻译等功能,从深度学习中获取到一系列商业价值。Google、、百度和阿里腾讯等使用的广告定位均由深度学习提供支持。而且在2016年夏天,使用由长期短期记忆(LSTM)算法(一种深度学习算法)编写的脚本导演了一部实验性短片Sunspring(有兴趣的同学可以自己去看看,这部短片完全由机器导演出来的)。


现在有一些发展正在推动深度学习,比如算法上的改进提高了深度学习方法的性能;新的机器学习方法提高了模型的准确性;已经开发出了新的神经网络类非常适合诸如文本翻译和图像分类之类的应用;现代社会拥有许多可用于构建具有许多深层的神经网络的数据,包括来自物联网的流数据,来自社交媒体的文本数据,病人的医疗数据;分布式云计算和图形处理单元的计算进步使我们拥有无与伦比的计算能力,这种水平的计算能力对于训练深度算法是必不可少的;同时,人机界面也有了很大的发展,鼠标和键盘已被手势,轻扫,触摸和自然语言所取代。这些无疑会对AI和深度学习的发展产生强大的促进作用。


深度学习应用方向

深度学习已经被诸多企业公司利用而开发出许多实际应用程序,从而在外部看来深度学习发展已经到了巅峰。但是实际上现在还仅仅是深度学习的冰山一角,随着计算机科学研究的继续发展,未来将会出现更多更令人惊喜的功能产品。


深度学习今天流行作用方向有:


语音识别

商业界和学术界都接受了深度学习来进行语音识别。和苹果的Siri就是一个很好的例子,现在Siri和普通人对话可以做到对答如流。


图像识别

图像识别的一种实际应用是自动图像字幕和场景描述。这对于在执法人员调查中至关重要,可以从大千的天网种抓出犯罪分子的脸庞从而找到他们。无人驾驶汽车还将通过使用360度摄像头技术从图像识别中受益于场景描述。


自然语言处理

神经网络是深度学习的重要组成部分,多年来一直用于处理和分析书面文本。这种技术是文本挖掘的一种专门技术,可用于发现客户投诉,病人病历等。


推荐系统

阿里和腾讯早就普及了推荐系统的概念,并有很大的机会根据过去的行为来了解你下一步可能感兴趣的内容。深度学习可用于增强复杂环境中的推荐,例如跨多个平台的音乐兴趣或服装偏好。


深度学习如何工作

深度学习改变了我们解决问题是先通过分析问题再来解决问题的传统思维。现在这个思维模式从告诉计算机如何解决问题变成了训练计算机解决问题本身。传统的分析方法是使用手头的数据来设计特征以得出新变量,然后选择分析模型并最终估算该模型的参数(或未知数)。


这些技术可能会产生无法很好概括的预测系统,因为完整性和正确性取决于模型及其特征的质量。例如,如果你使用特征工程开发欺诈模型,则应从一组变量开始,并且很可能使用数据转换从这些变量中得出模型。你可能最终得到模型所依赖的30,000个变量,然后必须对模型进行成形,找出哪些变量有意义,哪些变量没有意义,依此类推。添加更多数据的时候你还得重新做一遍,准确性不高不说,还特别费时间费精力。


而深度学习的新方法是用层次化表征(或层)代替模型的制定和规范,该层次化表征(或层)学会从层的规律性中识别数据的潜在特征。深度学习的范式转变是从特征工程到特征表示的转变。深度学习的希望在于,它可以导致预测系统具有良好的概括性,适应性,随着新数据的到达而不断改进,并且比基于硬业务规则的预测系统更具动态性。深度学习解放了大家都去找模型,从而让大家去训练任务训练数据得到结果。


那么我们该如何构建深度学习模型呢?


考虑到现在我们使用深度学习取得了很大的成功,万事皆可深度学习。但是必须强调的是,构建深度学习模型比艺术更是一门艺术。要为此构建深度学习或任何机器学习模型,需要考虑以下几点:


1、定义问题:我们拥有哪些数据?我们要预测什么?我们需要收集更多数据吗?我们如何手动标记数据?

2、我们可以使用哪些指标来可靠地验证结果的准确性;

3、准备评估模型;

4、数据预处理:这是花费大部分时间的地方,例如归一化、标签编码等。

5、开发一个比基准模型更好的初始模型,这表明机器学习对于该问题是否理想。

6、通过调整超参数并添加正则化来优化模型架构,根据验证数据进行更改。

7、避免过度安装


我们需要注意我们仍处于深度学习革命时期。由于深度学习史无前例的成功,导致现在很多商业机构都在炒作人工智能、深度学习。对于我们研究人员、学生而言,能够从媒体的炒作中提炼现实至关重要。尽管机器感知方面取得了进步,但我们离人类级人工智能还很遥远。我们的模型还只能执行局部概括。小苏旨在为大家提供一些兴趣化知识和考研指导,饶有兴趣地同学还是得进入学术界才能真正地摸清人工智能深度学习。


苏世学社旗下品牌,专注于计算机考研

计算机考研一手资讯,原创高质量干货

深度的学习分享丨咨询前辈丨个性化指导


考研杂谈 | 是什么让深度学习与众不同?的评论 (共 条)

分享到微博请遵守国家法律