数据挖掘一(自用)
(1)数据质量分析练习(异常值分析)
数据:ch03/data/catering_sale.xls
要求:
①查看餐饮销售数据的基本情况,打印基本统计特征
②对餐饮日销数据进行异常检测,通过箱型图展示异常值



(2)特征分析练习(分布分析)
数据:ch03/data/catering_fish_congee.xls
要求:
①分析菜品 “捞起生鱼片” 的季度销售情况,通过直方图展示销售额频率分布


(3)数据定性分析练习(分布分析)
数据:ch03/data/catering_dish_profit.xls
要求:
①分析某时段不同菜品销量的占比,绘制饼图展示分析结果
②分析某时段不同菜品的销售量分布,绘制条形图展示分析结果
饼状图:

条形图:


(4)对比分析练习
数据:ch03/data/dish_sale.xls
要求:
①按月对比分析不同部门的销售额,绘制折线图展示分析结果(部门间对比)
②按月对比分析各部门的同比销售额,绘制折线图展示分析结果(同一部门不同年份按月对比)
折线图


(5)统计量分析练习
数据:ch03/data/catering_sale.xls
要求:
①分析餐饮销量的统计量,除常规统计量外,另外计算:极差、变异系数、四分位间距
运行结果:


(6)周期性分析练习
数据:
ch03/data/user.csv
ch03/data/Steal user.csv
要求:
①根据user.csv分析正常用户的用电量趋势,绘图展示分析结果
②根据Steal user.csv分析窃电用户的用电量趋势,绘图展示分析结果


(7)贡献度分析练习
数据:ch03/data/catering_dish_profit.xls
要求:
①分析菜品对盈利的贡献,绘制菜品盈利数据的帕累托图展示分析结果

(8)相关性分析练习
数据:ch03/data/catering_sale_all.xls
要求:
①分析不同菜品与“百合酱蒸凤爪”的相关性,打印和绘图展示分析结果
