欢迎光临散文网 会员登陆 & 注册

从一个困惑的本科生变成经验丰富的机器学习工程师

2021-09-03 19:56 作者:深度之眼官方账号  | 我要投稿

不是标题党,真实的故事分享。开学季,部分人多少会对自己选择的专业有这样那样的担心。什么是自己喜欢的,怎么找到自己喜欢的并坚持下去,今天的这个分享全都讲到了。



正视迷茫期


在开始学习ML之前,故事的主人公已经获得了一份他们国家最大银行之一研发部门的实习生工作,接触的是端到端软件开发生命周期以及复杂的安全协议。这对一个本科生来说很幸运了,可是主人公陷入了迷茫,找不到这份工作的意义和价值,这是很多人都会遇到的问题。



生活中大多人遇到这种问题的时候会陷入焦虑,会权衡利弊,会拖延着等到实在拖不了的时候再开始做选择。


其实不必拖,可以学习主人公的方法——在与所学专业相关的行业中(主人公是计算机专业)筛选出自己喜欢的领域。


 

筛选兴趣


主人公是国外的,所以他在最开始利用freelancing sites,glassdoor,TED演讲,YouTube视频里面筛选热门的工作岗位(可能是爬取了相关行业的内容)。



数据科学领域引起了主人公的兴趣。然后主人公开始了解这个领域下的主要方向——数据科学家、数据分析师、数据工程师、机器学习工程师、BI 分析师、MLOps 工程师。


接着分析了这些角色的职业道路、经历、薪水和所有细节的统计数据。根据自身的优势,主人公认为机器学习工程师是最合适自己的,立马做出了选择。大家也可以尝试用这个方法来做选择,找到自己感兴趣的专业。


这里作者还推荐了两本书——《潜意识的力量》和《秘密》。这两本书能让你知道如何吸引你真正想要的东西,以及你的想法最终如何成为你。




给自己暗示


首先要相信自己,才能成为自己想成为的人。所以主人公设计了机器学习工程师title的新名片;笔记本电脑壁纸上写着“机器学习工程师”,帐户密码都改成类似于“mlengineer123”这样的,沉浸在成为这样的人的环境下。


“假装”的想法 帮助你改变你的身份,自然会被你想成为的人所吸引。




正确选择学习资源

现在网上的学习资源非常多,看来看去最后发现可用的资源挺少的,首先要明确应该学习什么?应该从哪里学习?



不能一上来就要掌握编程、统计、数据库、机器学习、深度学习、可视化等知识,恨不得马上成为数据科学家。

其实第一步你要做的是评估自己——你的长处和弱点。更没有必要去纠结是学R还是Python。

比如主人公对数学、编程和数据库相当熟悉,但是,对统计学知之甚少,最终选择了从Python开始入手。但最终,像许多其他人一样,最终同时使用了两者。如果你是统计/数学相关背景,可以先选择R,不过大多数人学到最后都是同时使用了两者。



入门资源推荐


初学入门


大家可以根据目前的知识和技能跳过其中的一些内容,或者将其用作某种参考资料。


密歇根大学在freeCodeCamp(13 小时课程-免费)上的Python for Everyone[1]或作为Coursera上的5门课程专业:本课程涵盖从数据结构到数据库再到使用Python的可视化[2]。这些对初期学习非常有用。


[1] https://www.youtube.com/watch?v=8DvywoWv6fI


[2] https://bit.ly/courserapy4e


可汗学院的线性代数和多元微积分。虽然主人公对所需的数学概念相当熟悉,但为了更好的直觉,也需要经常最终参考可汗学院某些资料。


线性代数:

https://www.khanacademy.org/math/linear-algebra


微积分:

https://www.khanacademy.org/math/multivariable-calculus


密歇根大学在Coursera上的统计专业。可以用来慢慢地开始了解所有的统计概念。并用可汗学院的统计和概率对此进行补充。


Coursera上的统计专业:

http://bit.ly/courserastats


可汗学院的统计和概率:

https://www.khanacademy.org/math/statistics-probability



必读系列


斯坦福在YouTube上的Andrew Ng机器学习讲座。当你学习本课程时,会感觉自己在慢慢地进入数据科学和机器学习领域。


https://www.youtube.com/playlist?list=PLoROMvodv4rMiGQp3WXShtMGgzqpfVfbU


Coursera上的deeplearning.ai的深度学习专业化。Andrew Ng以此开始革新深度学习教育。它涵盖了从零开始到高级计算机视觉和NLP技术的深度学习的每一个基本概念。(这个好像要付费,付费的话不如去找找国内的性价比更高的)

http://bit.ly/courseraDL


The Missing Semester of your CS Education by MIT。就比较难学,但是利于工作。

https://missing.csail.mit.edu/


以上全是外文网站,因为我们的主人公是国外的大佬,想要国内的学习资料就私聊学姐给你推荐吧!毕竟没有恰饭!



参加比赛的好处

在构建项目时可以学到很多东西,这比一次性掌握多项技能更能够提高能力。




比赛平台


Kaggle比赛:可以从新手区开始做比赛任务,也可以看到非常多的牛人的分享。Kaggle 建议开始的最基本的方法是传统的泰坦尼克号机器学习灾难。它可以帮助您了解完整的机器学习流程。


泰坦尼克号机器学习竞赛

https://www.kaggle.com/c/titanic


Udacity 项目:他们在GitHub上是开源的,并且以奖学金的方式激发学习和参与项目的兴趣。


国内的比赛就有很多啦!比如阿里的天池,华为,科大讯飞等等他们举行的比赛活动都可以参与。


从分享中成长

有意识地分享自己学习成果和创建的项目。这样做有什么好处?


在LinkedIn上分享成就,并始终有更新的LinkedIn个人资料和项目经验,招聘人员喜欢看到这个。

构建的每个项目、创建的每个笔记本都放在GitHub上。可以制作你作品的集合。(有些人更喜欢在Kaggle中分享所有内容,主要是因为社区很吸引人,所以也可以随意探索该选项)

在国内你可以写自己的公众号,放在CSDN上,做成视频放在哔哩哔哩上面都是可以的,会有很多粉丝还有专业大牛与你交流。



如果你要转行

请把心态放平,一定要记住职位不重要;你要做的工作类型很重要。


当你做不出选择的时候请问问自己这几个问题:

  • 我每天都会学到新东西吗?

  • 我将要做的工作会对生活或者世界产生影响吗?

  • 我会接触到这份工作的核心内容吗?还是在打酱油?

如果对上述所有三个问题的回答都是肯定的,那么就接受这份工作。不过选择也因人而异,任何时候都要明确自己能否承担的了选择后的后果。

今天的分享就到这里!对数据科学或者是机器学习还不是非常了解的同学可以关注公众号,后台联系学姐我们唠一唠。


文章来源:

https://pub.towardsai.net/how-i-went-from-being-a-confused-undergrad-to-an-experienced-machine-learning-engineer-5422d4a51a30

免责声明:所载内容来源互联网,仅供参考。转载稿件版权归原作者和机构所有,如有侵权,请联系我们删除。


从一个困惑的本科生变成经验丰富的机器学习工程师的评论 (共 条)

分享到微博请遵守国家法律