欢迎光临散文网 会员登陆 & 注册

艺人直播-Flink实时数仓

2023-07-05 17:00 作者:开心小豆芽  | 我要投稿

艺人直播-Flink实时数仓

网盘地址:https://pan.baidu.com/s/1V80nUnkV_rPhUqN0pYSFAA 提取码:wkwm

网盘地址:https://pan.baidu.com/s/18fZTGeoCWn16iO1I5NxABA 提取码: bivd

 

给大家分享一套大数据课程——艺人直播-Flink实时数仓,附课程代码+文档。

 

基于“艺人直播平台”业务背景的flink实时数据分析(实时数仓)项目,基于主流的实时数据分析系统技术架构实现,内含各类直播平台实时数据分析需求场景,各种flink技能点实战(含源码级修改),是巩固flink技能,快速获取flink实战熟练度不可多得的课程!

 

分析需求:

统计,总共开了多少个团,团的成团率、开团热门分类、团购订单数量、成交的金额、成交的分类金额、成交的区域金额。

1.实时拼团数量(维度:拼图的状态、商品分类[关联商品表获取分类ID])

拼团中的(状态),手机分类(商品分类),2(数量)

 

2.实时拼团的金额(维度:拼图的状态、商品分类[关联商品表获取分类ID])

拼团明细表 Left Join 订单主表 Left Join 拼团主表

 

案例:多流进行关联(Join)

 

比如三个流进行Join(拼团明细表 Left Join 订单主表 Left Join 拼团主表)

Flink窗口的Join、CoGroup不支持多个流在一个窗口内进行Join、CoGroup

 

解决方案一:

将两个流进行Join、CoGroup,将的得到Join后的流再查数据库关联信息(异步IO,要查数据库,效率较低)

 

解决方案二:

将两个流进行Join、CoGroup,将的得到Join后的流在跟第三流进行JOIN(有两个窗口,在窗口中进行Join,数据是放在WindowState中,效率高一些)

 

 

简化后的数据:

拼团主表:主表ID,拼团状态,分类ID

拼团明细表:细表ID,拼团主表ID, 订单ID

订单主表:订单ID、订单总金额

 

join后的结果

拼团主表ID,订单主表ID,订单总金额,拼团状态,分类ID、(省份)

 


艺人直播-Flink实时数仓的评论 (共 条)

分享到微博请遵守国家法律