BI数据工程师的数据库基本功1
今年是第一批“大数据”人才毕业的高峰期,作为一名非著名的数据打工人,很长一段时间只是一个抽数的工具人;同时也是一名野生的数据搬运工非科班出生的BI老鸟,写一点东西送给想入行数据领域的你。
由于非科班出生,也没有那么多规矩、没有那么多理论;干就完了,只要不会死人就往死里干,累了就休息一下总结经验,总结后看有没有改进的方法或者不用在重复劳动,最好能找到方法减少重复劳动,这一点非常关键。
在经历了十几个BI项目数据仓库及报表的搭建、上千个存储过程的设计开发后,才拥有了一点点心得,也许我写的是一种做这件事情的思路不是具体代码,并不适应与所有人。我个人认为思路最重要,把思路理清楚了后面的SQL代码就非常轻松容易实现;如果思路不理清楚后面的SQL代码就会无羞耻的修改。如果把思路理清楚了最后剩下的就是不断的练习。
一、如何理解数据库
二、如何从业务需求到数据库设计
三、如何让业务需求变成SQL语句
四、解读每一个数字后面的业务
今天写第一点:如何理解数据库,
数据库是任何企业的大脑,任何企业都离不开数据库;而且企业要求IT人员 及 数据运营 都要会数据库,这里已经发生了一个改变,以前只要求IT人员会数据库,最近几年还要求数据运营人员会数据库。
那么如何理解数据库,怎样让刚入行的人来理解数据库;
第一点:如果别人给一堆Excel 表格给你,不告诉你这个企业是做什么的,你看完Excel中的数据能猜出这家企业是做什么行业的吗??
第二点:能从Excel的数据中提炼多少个业务模块来??
第三点:你认为Excel保存那么多企业数据安全吗?
这里我只提了三点,这三点中的两点涉及到业务另外一点是安全性;所以理解企业内的各种数据库首先得熟悉企业的业务;数据库与企业业务紧密相关;也就是说读懂了他们的数据库就是读懂了他们业务。
数据库是一个抽象虚拟的东西,能看见但是你摸不着。数据存储在计算机的存储器,如何经过复杂的处理让你能看见这个对于BI数据工程师不用去了解,这是数据库管理员的职责,但是大部分企业是没有数据库管理员,所以由BI数据工程师自行解决。
数据库是一个抽象的东西,理解它必须要有概念思维,因为它不是真实又是真实存在;所以我将用三张图来表达一下我对数据库的理解。
第一张图完全是数据库技术方向的,数据库管理员是重要角色,其次是BI数据工程师,
数据库分为物理层——》逻辑层——》视图层;内模式是数据库内部在计算机上存储的模式;概念模式就是企业视图把企业业务编制一张网,然后把这张网存入数据库;外模式是通过这张企业业务视图网去内模式拿想要的业务需求。最后BI数据工程师通过操作外模式完成工作。那么重点就在这张网怎么编?

第二张图数据库管理员和BI数据工程师已经没那么重要了,而中层管理的业务管理分析和指标体系才是重头戏;前面留下一个疑问点企业业务编制一张网,这张网如何编,这时BI数据工程师就是根据管理层的决策方向、考核重点来编制这张网。其实这样的BI数据工程师就是抽数工具人,年轻的时候抽一抽数还可以,如果到了中年还是一个抽数的就尴尬了;这也是为什么很对企业把BI数据部门废掉了或者外包;就是因为产生不了多大的价值,他们专心做市场做产品、品牌 高价值的事情。

第三张图……………………………………..
