数仓建模 项目_音乐数据项目火力全开,技能双倍提升!

音乐数据中心数仓综合项目

数据仓库大家都听过,是存储数据的数据库
以下是基于大数据的spark项目介绍
1、项目介绍
音乐数据中心项目是大型企业级综合数仓项目,此项目针对音乐数据进行分析,构建数据仓库,建立用户、机器、内容等主题进行数据分析,涉及数仓建模理论基础、数仓建模规则、数仓建模命名设计规范、数仓分层设计、数仓数据采集、数据ETL、数据质量检验、各主题业务处理流程设计、实时数据处理、任务流调度、数据可视化等实际企业级大数据数据中心建设使用到的方法论及实际技术使用流程。
音乐数据中心主要使用技术如下:
CDH
flume
sqoop
HDFS
Spark
SparkSQL
Hive
Hbase
Zookeeper
kafka
mysql
redis
yarn
superset
Azkaban
......
2、项目核心功能模块
音乐数据中心数仓项目主要分析业务如下:
针对业务数仓建模分层设计
关系型数据库批量、实时采集到数据中心
SpringBoot日志采集接口采集日志数据到数据中心
歌曲、歌手热度分析
机器分布分析
机器位置信息统计分析
活跃、留存用户分析
用户机器营收分析
商户营收数据分析
地域营收分析
实时热歌榜单分析
实时PV/UV统计
音乐排行榜统计

了解这么多这些只是适合哪些人群呢?
3、适合人群
掌握Hadoop及HDFS原理和使用
掌握Hive、HBase、Sqoop、Flume工具
掌握SparkCore,SparkSQL,SparkStreaming原理及代码编写
掌握azkaban原理及使用
掌握Kafka原理及使用
掌握redis原理及使用
综上所述,我们片面的了解了一下数据仓库理论及其项目,想要深入了解及学习可以点击视频学习哦~
