数据分析第1篇|概念扫盲:三个简单故事,轻松理解数据分析
1 契机:为什么要做这个专题?
从今天起,打算做一个关于数据分析的专题,分享给大家。
首先声明,这不是广告,也不是卖课,放心阅读。
我研究生毕业后的第一份工作就是「数据分析师」,一路走来,从数据分析师,再到数据产品经理,如今已是第 7 个年头。
因为一直是兴趣驱动,而且天性爱折腾,所以这 7 个年头里自认为没有一天是安于现状,对我来说工作就是生活,生活就是工作,从来没有分开过。
再加上工作之余又热爱编程,经常在「人文帮」公众号分享一些我原创的数据分析与数据处理工具,所以对数据还是有较深的认知和理解。
最近在对自己在数据这块的认知和经验进行梳理沉淀,分享给大家,既是对自己职业生涯的一个复盘,也希望通过这个过程,进一步提升自己的专业能力。
还有一个虚荣心的因素,我想让锦一在长大后,可以看到她爸爸过往写过的文字,做过的工作,可以对别人说:看,这是我爸爸写的,厉害吧!
2 关于数据分析的三个故事
言归正传,什么是数据分析?先来看下维基百科的定义:
数据分析是一种统计学[1]常用方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。
有点晦涩,简单来说,数据分析就是从数据中提取有价值的信息的过程,进而用于决策。
我讲三个故事,来帮助你理解一下这个概念。
故事 1
有一次,带锦一去一家儿童游乐场去玩,到吃午饭时间了,带着锦一去吃饭。
负一楼是个美食广场,那么多吃的,去哪一家呢?正打算打开美团看看评分,锦一大喊:我要去那家!我要去那家!
原来那是一家主打儿童套餐的餐厅,我问锦一,为什么去选择这个呢?
锦一说:你看嘛!这里有那么多小朋友都在这里吃饭呢。所以我也想去这里吃。
故事 2:
我最近想要买一个显示器。我的预算 2000 元内,要求分辨率在 2k 以上,那我要买哪一款呢?
很快,我就在京东上锁定了几款显示器,为避免打广告的嫌疑,就不放截图了。
我大致看了下每个显示器的评价,评分,最终下单买了其中一款。
故事 3:
这个故事相信你肯定也经历过或者即将经历,那就是写毕业论文,而且要求是有实证分析的毕业论文。
研究生毕业时,我的论文主题是「我国上市公司财务重述与终极控制股东性质的相关性」。
所谓的财务重述,你可以简单理解为「发了财务报告后」发现不对,又发布补充或者修正公告。
这个过程很煎熬。
那个时候我还不会使用 Python,要去收集近 7 年每家上市公司是否发布过修正公告,要逐个去确认。
最后再根据收集的这个数据进行逻辑回归分析,最终得出财务重述与上市公司控制股东性质的结论。
以上三个故事,其实,每个故事都是一个数据分析的过程。
在第一个故事里,锦一虽然只有 4 岁,但是她靠餐厅中其他小朋友的数量决定了要去哪里吃饭。
在第二个故事里,我通过京东提供的价格数据和评价数据进行分析,最终决定了我要买哪一款。
第三个故事里,我通过逻辑回归等分析方法分析数据,最终得出结论,完成论文。
相信通过以上三个故事,你已经理解什么是数据分析了。
其实,数据分析并不是数据分析师的专属,人人都是数据分析师。
比如说中午去哪里吃饭,周末去哪里玩,你要和谁约会,去哪里约会……
这些生活日常,你如果深究下来,你会发现,背后都有数据的影子,只是你没有注意到罢了。
参考资料
https://www.yuque.com/soaringsoul/data_analysis

