做数据分析的女孩子,职业发展前景在哪里?数据分析枯燥吗?——分享故事
作者:yifhom
链接:https://www.zhihu.com/question/20115622/answer/1023609115
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
之前在刚毕业加入互联网这行的时候,也很焦虑也很着急,那会儿特别想做互联网产品序列的工作,但是脑袋里一片浆糊,不知道从何入手。
我先说说我的经历,然后再顺着我的经历讲数据分析这块的学习和提升的方法论,避免大家少走弯路,能用正确的方法快速成长。
我刚毕业那会儿是13年,面了很多网络游戏公司,因为从小特别热爱游戏,也面了很多互联网公司,因为那会儿移动互联网刚起步没多久是一个风口,自己也挺喜欢,最终还是选择了游戏行业,因为还是遵循内心最真实的想法,选择自己热爱的领域作为未来的事业,这个选择一直到现在我都觉得很正确。
13年那会开始以管理培训生的身份到北京的一家知名游戏公司实习,机缘巧合,被选拔到了上海分公司做产品运营,负责一个moba+rpg项目的商业化和产品调优模块,刚去那会儿哪儿会这些专业的东西啊,去的时候甚至连封闭测试的目的都不知道,后来也是一个个问在工作中打磨出了方法论。说实话当时负责的是商业化和产品调优模块,如果你没有数据,你怎么去给研发提调优建议,怎么去设计商业化活动,如果商业化活动有问题你连调整的依据都没有,所以从那儿开始就开始接触数据分析的工作。
最开始的时候,我们内部对于用户流失的指标定义有很大的歧义,但是如果这个指标不确定下来,我们接下来的分析的结论会出现很大的偏差,最终会影响我们的调优决策,从而影响最终的业务,当时因为年轻也没有考虑太多就按照公司统一标准来,但现在转过头发现,真的很坑,当年的很多结论都是不对的,严重影响了大家的决策和判断。这里提到第一个点,叫做:业务数据指标的定义。这个东西至关重要!!!
当我们有了业务指标的定义的时候,需要去确定很多东西,比如说观测数据的维度,统计的周期等,比如拿一个最简单的流失分析来说,可能我的分析思路是抽丝剥茧,从大到小,逐项缩小范围的分析方式,那么具体分析的时候怎么分析呢?很多人都知道是看流失时的等级,如果等级看不出具体问题,还得到任务,如果任务还看不出来要到具体的客户端点击,当然这些都只是常规的操作,甚至如果有足够的经验和积累,不用做分析都大概知道哪里有问题,我们需要的分析不仅仅只局限于此,而是要更加的深入,深入的玩家背后的动机。这里提到第二个点,叫做:数据观测的维度,和统计的周期。这个东西同样直观重要!!!
在上海做了一年的产品运营之后,后续我调回北京总部,担任数据分析师,我是从普通数据分析师一步步走上管理岗位的,现在是公司业务数据部门的负责人,当然在15-19年这四年的过程中,对于产品设计,产品运营,数据分析,机器学习等相关领域均有比较深度的涉猎,所以在数据驱动业务这个事务上还算处理得比较得心应手,也推动了公司往“数据驱动”和“精细化运营”的方向发展,公司在这块的投入也逐步加大。
对于数据分析的小白而言,对于我现在培养的应届生而言,我有如下几个要求:
第一,技术需要过硬:
1)sql语句,你必须要给我学精通了,增删改查,以及存储过程你都需要样样精通,这块的话,给大家推荐一个学习地址,如果大家感兴趣或者有问题可以私信我要我之前整理学习文档资料
SQL 测验
2)python,python的学习是为了让你后续处理繁杂庞大的数据集时更高效更方便更快速,以及后续有很多机器学习也好,或者深度学习也好的应用项目你能上手。这里推荐一个学习地址,大家可以多看,如果有问题可以私信我要我之前整理的学习文档资料
Python教程

第二,掌握或精通一部分常用的数学原理:
1)基本数学原理,统计相关的原理,比如平均值,方差,标准差,导数,反函数,拉格朗日等等,这里大家可以去csdn也好或者淘宝也好买一本相关的书籍就够用。
2)机器学习算法原理:回归算法,分类算法,聚类算法等等,比如最简单的分类算法:决策树,他的数学原理你真的掌握吗?信息熵和条件熵是啥意思,怎么计算的知道么?如果你只能调包,那么解决简单的问题ok,涉及到很多复杂的情形,比如样本不均衡,比如特征过少时,你就无从下手。这块的话,推荐大家多去逛逛csdn这个论坛,很有用,能学到不少东西。如下链接大家可以翻译成中文好好看,如果需要详细的算法原理资料,可以私信找我
https://scikit-learn.org
3)动手做一些虚拟案例,或者参与组里同事的一些项目,比如一个游戏内广告聊天拉人识别的项目,其本质是通过分类算法达成文本识别,这块涉及到的知识点可能有:文本处理,分类算法应用等,这块可以多去github上转转,有一些也许是已经运营过的案例能够给你启发的。
第三,不断加强自己对产品的感知力:
1)如果是游戏行业的:
多玩不同品类的产品,每个品类选择1-2款精品深度体验,注意是深度体验,而非浅尝辄止
随着版本迭代深入体验,并且需要思考每一次的版本迭代和周更新的原因,反推业务需要解决什么问题
带着问题去玩游戏,边玩边记录自己的感受,有经济能力就充点小钱,后续商业化分析部分会用得着
做个有心人,记得多游戏横向之间做对比
不要看gamelook等媒体上的测评稿,那些大多数是枪稿,要自己去体验,用心去体验,不要人云亦云
多跟制作人层面的人交流宏观的设计理念(如果有机会的话),多跟数值策划学习数值规划的流程(职业,属性,战斗公式,属性配比放出,商品定价,游戏内经济流转设计等),多跟系统策划学习系统架构的知识(做一个系统目的是啥,是为了解决什么问题?),多跟产品运营学习运营知识(比如商业化设计,活动设计等等),多跟市场发行的同学学习相关知识(营销方法论,买量等),还有很多,不一而足...
2)传统互联网(非游戏):
多体验互联网产品,要多而广,因为互联网产品跟游戏产品还不一样,他的体验成本(时间和精力)比具体游戏产品小很多,所以尽可能多而广,我现在仍然保持着每周至少体验5个新互联网产品的习惯,比如社交类的,可以多体验体验陌生人社交的,熟人社交的,多思考产品之间有什么共性和不同点
带着问题去体验产品,主要反推产品做成这样有什么好,有什么不好,产品主要为了解决什么问题,他的业务目标有可能是什么样
经常跟圈内人去探讨和交流,跟游戏不一样的是,互联网有很多的沙龙,可以多参加这种沙龙,但是不要杂而广,要专而精,现在有很多的沙龙就是为了做而做,为了感动自己而做,这种没有必要参加
时刻关注竞品,比如你是社交产品公司的,那么微信也好,陌陌也好,每一次版本迭代,你都需要去思考他为了解决什么问题,然后结合具体的内容去评估他的目的是否达到。
这里推荐1个能获取到较新互联网资讯的app:36kr,用这个基本上就足够了
第四,多做数据积累,多思考,多提问:
我们在做具体的数据分析的时候,有时候需要快速响应业务,有时候通过传统分析方法很难找到问题点,这个时候积累就至关重要,游戏行业的产品决策,40%依靠数据,30%依靠用户反馈,还有30%依靠经验,这个经验就是积累。
积累是什么?积累是过往的产品调整,活动设计,跟数据之间的关系,我们只有在每一项工作都认真严谨对待的基础上,这个积累工作才能做好,这样你的产品和数据敏锐度会越来越高,后续你可以跨界成为产品专家。
第五,给自己的定位不光是数据分析师,而是半个产品或运营负责人
我们有很多的数据分析师,一直都处于很被动的状态,业务提什么需求你照做,久而久之就变成一个机械式地接需求完成需求的人员,毫无存在感。怎么改变这个现状呢?第一是要多做积累就如同上述第四点所说,这块急不得需要时间,第二是需要主动,把自己当作半个产品或运营负责人来对待,这样面对日常数据的时候,你会主动去完善日常监控指标,你会每日去盯着数据的异常和变化,你会根据这些异常和变化往下去进行深度的挖掘,或者数据没有异常时,按照经验这个阶段该做什么分析了,赶紧做,发现了问题或者潜在风险赶紧跟业务聊解决方案,这样才能将数据分析师的价值发挥到最大