计算机毕业设计hadoop+spark+hive医生推荐系统 医生数据分析大屏 大数据毕业设计












流程
1.Python爬虫采集中华健康网约10万医生数据,最终存入mysql数据库;
2.使用pandas+numpy/hadoop+mapreduce对mysql中的医生数据进行数据分析,使用高德地图解析地理位置,并将结果转入.csv文件同时上传到hdfs文件系统;
3.使用hive建库建表,导入.csv数据集;
4.一半指标使用离线数仓hive_sql分析,一半指标使用实时数仓实时计算Spark之Scala实现;
5.使用sqoop将分析指标导入mysql数据库;
6.使用Flask+echarts实现可视化大屏界面;
创新点
高德地图解析地理位置、海量医生数据、Python爬虫、炫酷可视化大屏
选装
可选装知识图谱、推荐系统、预测系统、后台管理等
实现界面如下(可0秒无缝对接安装上):
https://www.bilibili.com/video/BV1ah4y1M7Jx/?spm_id_from=333.999.0.0
https://www.bilibili.com/video/BV11N411D7Yd/?spm_id_from=333.999.0.0



















