欢迎光临散文网 会员登陆 & 注册

杭州珍瓒传媒/大众点评的美食数据分析

2023-03-29 10:27 作者:时光裁缝铺  | 我要投稿

前言

近年来,随着互联网的不断发展,使用互联网的人数不断上升,大众点评网首创并领导的第三方评论模式已成为互联网的一个新热点。 大众点评移动客户端通过移动互联网,结合地理位置以及网友的个性化消费需求,为网友随时随地提供餐饮、购物、休闲娱乐及生活服务等领域的商户信息、消费优惠以及发布消费评价的互动平台,大众点评移动客户端已成为人们本地生活必备工具。而大众点评的数据也蕴含着大量的信息,值得数据研究者们进行挖掘和分析。

本实验将使用python以及pyecharts对大众点评的12个城市的美食数据进行分析,包括食分布分析、美食类型分析、美食价格分析和美食评分分析等。以期能揭示当前国民饮食偏好的一些规律,为后续的研究提供一定的参考。

01 概述 

1.1 大众点评概述

大众点评网于2003年4月成立于上海。大众点评是中国领先的本地生活信息及交易平台,也是全球最早建立的独立第三方消费点评网站。大众点评不仅为用户提供商户信息、消费点评及消费优惠等信息服务,同时亦提供团购、餐厅预订、外卖及电子会员卡等O2O(Online To Offline)交易服务。

截止到2015年第一季度,大众点评月活跃用户数超过2亿,收录商户数量超过1400万家,覆盖全国2500多个城市及美国、日本、法国等近百个热门旅游国家和地区。除上海总部之外,大众点评已经在北京、广州、天津、杭州、南京等160多座城市设立分支机构。

大众点评月综合浏览量(网站及移动设备)超过150亿,其中移动客户端的浏览量超过85%,移动客户端累计独立用户数超过2亿

因此就美食领域而言,大众点评是当之无愧的巨头,其拥有的包含用户数据、商户数据、评价数据等的大型数据库蕴含着巨大的财富,吸引了众多数据爱好者对其数据进行挖掘和分析,以从中获得各种饮食规律



1.2 实验目的

通过对大众点评数据的分析,获得各地人民的饮食偏好、全国人民的饮食偏好、店铺价格、店铺评分等规律,从而对国民的饮食习惯有一个较为深入的了解。


1.3 实验思路

此实验的实现分为以下几个步骤:

(1)数据的获取

找到大众点评可用的数据接口或者一些没有设置反爬措施的网页,对各地热门的餐厅信息进行获取,并存储到本地上。

(2)数据处理

对获取到的信息进行清洗,去除无意义和无用的信息。同时对收集到的信息的有用条目进行组织,做出必要的处理或者更改。

(3)可视化分析

使用可视化工具,对经过处理的数据进行可视化分析,从中归纳出规律

(4)形成结果

将可视化的图像整合,形成一个完整的大屏可视化结果;同时将每个图所得出的结论根据完整的可视化结果进行重新组织,以形成最终的分析结论。


1.4 实验意义

此次对大众点评数据的分析主要从以下四个大方面进行分析:评分分析、地点分布分析、类型分析以及价格分析。

评分分析可以探寻热门餐厅与评分之间的关系,即探讨“网红店铺”与“优质店铺”之间是否存在着完全的相关性。

地点分布分析可以帮助读者探寻各地的美食热门区域。

类型分析可以发现国民普遍青睐的美食类型,也可以通过对不同地区美食类型的分析来分析各个地区的差别。

价格分析可以看出目前人们的饮食消费水平。

该实验对于了解国民的饮食习惯、各地的商圈特征等具有一定的意义。

02 数据收集

2.1 数据来源

由于大众点评网站本身有反爬虫的设置,在多次爬取数据后会被要求输入验证码,因此无法直接从它目前提供给用户的网页端中爬取有用的信息。与此同时,网上提供的现成的各类大众点评数据集的时效性不够,大部分都是2018年以前的数据,分析意义不大。所以爬取数据成为了这次实验的第一个挑战。

在浏览了各类资料后,我终于找到了大众点评的一个网页,它可能是被目前的大众点评网页端所放弃的一个网页,里面虽然同步更新了热门店铺信息,但是没有进行页面的装饰,也没有设计反爬机制。对于每个城市,该页面都会展示该地的美食排行榜,可以按照自己的需要进行页面的选择。

本次实验我选择了12个城市,分别是上海、北京、杭州、成都、重庆、西安、武汉、苏州、广州、深圳、南京、天津。这12个城市有着其对应的城市ID,只需要对网址中最后的Rnakid进行更改,就可以访问对应城市的页面进行数据的爬取。例如下图的上海热门美食排行榜,网址为:


2.2 获取方式

我采用python编写程序对网页中的数据进行爬取。

代码如下:



根据自己的数据需求,我选择了店铺名称、地点、类别、口味评分、环境评分、服务评分、总体评分、平均价格和城市这几类数据,按照各个城市进行组织分别存储于csv文件中,同时为了分析的方便,又将所有的数据汇集起来存储到一个新的csv文件中,命名为“nation.csv”。


2.3 获取结果

爬取后的csv文件格式如下图所示(以上海的数据为例):


03 可视化工具 

3.1 pyecharts简介

Echarts 是个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时pyecharts 诞生了。

它具有以下特性:

⚫ 简洁的API设计,使用如丝滑般流畅,支持链式调用

⚫ 囊括了30+种常见图表,应有尽有

⚫ 支持主流Notebook 环境,Jupyter Notebook 和JupyterLab

⚫ 可轻松集成至Flask, Django等主流Web框架

⚫ 高度灵活的配置项,可轻松搭配出精美的图表

⚫ 详细的文档和示例,帮助开发者更快的上手项目

⚫ 多达400+地图文件以及原生的百度地图,为地理数据可视化提供强有力的支持


3.2 选择原因

选择pyecharts的主要原因是我们在课程中进行实操的便是pyecharts这个工具,相比于其他工具而言,我对它的熟悉程度要更高一点。而且通过对gallery案例的浏览,我发现pyecharts其实可以实现大部分的可视化功能,因此便选择了pyecharts作为此次可视化大作业的工具。

04 可视化过程

4.1 数据处理

爬取后的数据已经相对规整,基本不用再进行其他的处理。唯一的处理就是在地图可视化时,需要将地点数据改为各自地点所对应的区,由于这一类目下的地点十分零散,我对各个城市的区域划分也不是很了解,没有办法通过编程来实现自动数据处理的目的。所以最后这列数据是经过了手动处理形成了规整的所属区域格式的。


4.2 数据可视化

(1)绘制全国美食类型柱状图(以12个地区的数据代表全国)

对总体数据的美食类型进行分析,而已概括出目前国民饮食偏好的较为普遍的规律


由于要收集的是全部城市总体的数据,于是选择读取“nation.csv”这一个数据文件。从文件中提取“类别”这一特征,加入到category列表中,并采用Counter来统计列表中各个元素的个数,即各个美食类别的个数。将种类和数量分别存入datax和datay列表中。

使用pyecharts中的bar进行柱状图的绘制。使用reversal_axis对柱状图的坐标进行翻转,变成了横向的柱状图。为了使美食种类的标签得以完全显示,使用rotate对标签进行了旋转。设置主题为VINTAGE,为了后续将不同的图结合起来的一致性考虑。


(2)绘制各个地区的热门美食类型top5

上一个柱状图显示的是较为总体的热门美食类型,但由于不同地区的消费水平、地理环境等因素的不同,饮食偏好应该会存在一定的差异,为了探究这一差异,我选择绘制一个矩形树图。



由于矩形树图输入的数据结构比较复杂,并不是简单的列表,所以需要对各个城市所提取出来的数据进行转换,转换为“name: xxx, value: xxx, children: xxx”的格式。并将该数据送入到treemap中进行绘图。按照所需要的层数设置levels。

效果如下:


(3)绘制美食分布地图

了解各地热门餐厅的分布情况,有助于我们掌握各个城市的美食聚集区域,可以成为未来的旅游指引。

代码如下:


在绘制地图时,我遇到了一个比较棘手的问题:pyecharts所提供的地图精度不够。我原来的设想是将所有城市的区域信息整合到一张中国地图中,随着鼠标的放缩可以浏览各个城市美食的区域分布状况。但是pyecharts提供的中国地图最深只能到达省级,无法到达市级,更别说是市级下属的区县级。为了能够到达各个区县级,我只能采用分个的城市地图,而不是总体的中国地图。但由于我最后想呈现的效果是BI大屏的类型,所以不能将所有的城市地图同时呈现在界面中,需要对界面做一定的隐藏,再根据交互来显示用户需要的信息。

所以这时我就想到了用tab对各个城市的地图进行一个分页,然后在最后整合时再将这个tab页面加入到page中。但这个想法在后来的实践中也失败了,因为在pyecharts中tab和page是同级页面,这意味着我无法将tab页面加入到page中。

最后我发现了地图中自带的add方法可以将不同城市的地图整合在一个页面里,但它呈现的形式是所有地图叠在一起,显得很杂乱。在仔细研究了各个图例如何显示和隐藏后,我采用了is_selected参数,对除了上海之外的城市图例进行了隐藏,只有当点击时其他城市的地图才会显示。这个方法也存在着缺陷,就是进行地图的转换时需要点击两次(一次隐藏当前地图,一次显示所需地图),相比于tab的点击切换功能来说操作的确有点繁琐,但这已经是在兼顾pyecharts的功能和界面的美观程度下的最佳解决方法了。

效果如下:

(4)绘制水滴图

动态的水滴图可以反映某种事物的比例,在该实验中我将用水滴图来反映高分店铺比例以及高人均餐厅比例。


因为水波的初始颜色为蓝色,与整个主题的颜色不太符合,所以将水波的颜色改为粉红色


(5)绘制散点图

散点图主要是用来分析两个指标之间是否存在关联性的图像,在此实验中我选择利用散点图来探究人均价格与各城市GDP的关系,以及人均价格与评分之间的关系。



首先读取每个城市的数据,对人均价格进行求和,计算每个城市的平均人均价格。然后读取之前手动在网上收集2019年各个城市的GDP资料。分别作为x值和y值传入scatter里面进行绘图。这里的难点在于当鼠标悬浮在散点上时显示的tooltip文本内容以及格式的处理。后来经过对gallery中示例的查找,我发现在TooltipOpts中的formatter里面可以自定义文本的内容以及样式,但需要使用javascript语言,于是我对javascript的语法进行了粗略的学习,并且不断地修改formatter中的参数以观察不同参数的含义以及效果,最后终于完成了我想要的效果。


(6)绘制饼图

饼图是用来反映比例的图像,在该实验中,饼图绘制的是全体热门餐厅中的评分比例,可以用来分析热门餐厅的总体水平。


为了使整个页面不至于太单调,我将饼状图设计成了玫瑰图的样式。并且为了整个页面的排布不至于混乱,我取消了图例,改为图上的标签和当鼠标悬浮时浮现出来的对应信息。

效果如下:


4.3 结果整合

我设想的最后的呈现效果是类似于BI大屏的各个图像的有机组合,所以选择了page对所有图像进行整合。并将结果存储到一个html文件中。

代码如下:

由于实验的主题是美食,所以不适宜使用传统BI大屏所常用的科技感主题,相反,我选择了较为温暖的主题:VINTAGE主题,这个主题更加符合美食的特征。为了使各个图片可以进行自定义的排列,而不是默认的顺序排列,我将layout参数设置成了DraggablePageLayout,这意味着我可以对图形进行拖拽来实现自己的可视化最终展示成果。图像布局完成后,可以点击页面中的“save config”按钮对布局进行存储,随后运行“Page.save_resize_html”语句,根据刚刚存储的布局文件形成最终页面 。

效果如下:


05 可视化结果分析

5.1 美食类型偏好分析

实验中对于人们的美食类型偏好分析分为以下两种:对于总体的美食类型偏好分析、对于各个城市的美食类型偏好分析。

对于总体的美食类型偏好分析,我选择了柱形图作为表现的形式。柱形图采用长方形的形状和颜色编码数据的属性,可以利用柱子的高度来反映数据的差异。在这一情景中,利用柱子的高度来反映对应美食类型中的店铺数量是较为合理的,而且由于美食类型较多,选择柱形图可以使整个界面较为整洁,优化视觉体验。

在对于总体的美食类型偏好分析中,可以看出人们对于西餐和火锅最为热衷。大家喜欢吃西餐的原因不难理解,当人们在家中吃惯了中餐时,便会想要外出就餐,而西餐种类较多,较为正式,可以满足不同的社交需求和饮食需求,因此西餐会成为人们外出就餐的主要选择之一。除了西餐,火锅也是人们很喜欢的一种美食类型,虽然图片中的重庆火锅数量略少于西餐数量,但是四川火锅和其他类型的火锅都得以上榜,相加起来的总数远超过西餐的数量,就该数据而言,不难看出国民们对于火锅的热爱。火锅被人们喜爱的原因大概是口味丰富,而且火锅所营造的热闹社交氛围符合中国人喜欢群居的天性。

就外国料理而言,人们比较喜爱西餐、日本料理和韩国料理。日韩料理由于比较符合国人的饮食习惯,受到了人们的喜爱。

就国内菜系而言,排名靠前的菜系有川菜、粤菜和浙菜。

对各个城市的美食偏好分析,由于要对不同的城市数量前五美食类型进行展示,所以我采用了矩形树图。矩形式树状结构图(Treemap)是一种有效的实现层次结构可视化的图表结构,简称矩形树图或树图。在矩形树图中,各个小矩形的面积表示每个子节点的大小,矩形面积越大,表示子节点在父节点中的占比越大,整个矩形的面积之和表示整个父节点。通过矩形树图及其钻取情况,我们可以很清晰地知道数据的全局层级结构和每个层级的详情。相比于同样是用来表示层级结构的旭日图,矩形树图更适合表示层次较少的数据,也更适合这次实验的任务。

通过分析,可以看出各个城市的饮食偏好。

重庆排名前五的美食类型为:重庆火锅、川菜馆、面馆、西餐、融合烤肉。

武汉排名前五的美食类型为:重庆火锅、湖北菜、日本料理、川菜馆、韩国料理。

西安排名前五的美食类型为:陕菜、东南亚菜、面包烘焙、老北京火锅、面馆。

杭州排名前五的美食类型为:浙菜、创意菜、西餐、面包烘焙、四川火锅。

天津排名前五的美食类型为:西餐、自助餐、天津菜、日本料理、四川火锅。

南京排名前五的美食类型为:韩国料理、西餐、淮扬菜、日本料理、茶餐厅。

苏州排名前五的美食类型为:面馆、茶餐厅、苏帮菜、西餐、咖啡厅。

成都排名前五的美食类型为:四川火锅、川菜馆、串串香、自助餐、重庆火锅。

北京排名前五的美食类型为:西餐、老北京火锅、烤鸭、重庆火锅、川菜馆。

深圳排名前五的美食类型为:粤菜馆、西餐、火锅、茶餐厅、日式烧烤。

广州排名前五的美食类型为:粤菜馆、西餐、广州菜、日本料理、粤式茶点。

上海排名前五的美食类型为:重庆火锅、茶餐厅、自助餐、西餐、粤菜馆。

从中可以看出各地的美食偏好都带有很浓烈的地区特征,本地的代表菜系往往会被本地的人们所选择,比如苏州的苏帮菜、杭州的浙菜、广州的粤菜等。因为这些当地特色美食都是顺应着当代人的口味和该地区的地理因素,在长时间的演变中形成的,所以自然而然会成为当地居民外出就餐的好选择。而上海的代表菜系之所以没有上榜,可能是因为上海在长时间的发展中都是文化交融的国际大城市的定位,外来人口较多,自然而然地带来了各地的菜系,从而形成了多种美食交汇的饮食结构。

同时对于各个城市的美食类型分析,也进一步验证了人们对于火锅、西餐、日本料理以及韩国料理的喜爱。


5.2 美食分布分析

由于对美食的分布分析需要展现它们的地理位置,因此我选择了地图加热力图这一可视化表现形式。地图为底用来显示各个店铺所属的区域,热力图叠加通过颜色来判断该区域的店铺数量。

由图可知,上海市热门餐厅最为聚集的区域是黄浦区,其次是静安区和徐汇区,随后是长宁区和浦东新区。嘉定区、宝山区、普陀区、杨浦区和闵行区分布的餐厅数量不多。

北京热门餐厅最为聚集的区域是朝阳区,其次是东城区、海淀区和西城区。

南京热门餐厅最为聚集的区域是玄武区,玄武区包含了70所餐厅,占全部餐厅的70%。除此之外,鼓楼区和秦淮区也包括了一定数量的餐厅。建邺区、雨花台区、江宁区、栖霞区和浦口区分布着若干餐厅。

天津和平区、南开区和河西区三个区域包含了绝大多数的餐厅,其余有餐厅分布的区域为:河北区、河东区、红桥区、津南区、西青区和静海区。

广州热门餐厅聚集的区域有天河区、越秀区、海珠区和荔湾区,花都区、白云区和番禺区各分布了1、2家热门餐厅。

成都而言,热门餐厅主要分布在市中心的区域中,包括锦江区、青羊区、武侯区、金牛区和成华区。其他的区域基本没有热门餐厅的分布。

杭州热门餐厅的分布呈现以上城区为中心,逐步向外扩散的特征。

武汉的热门餐厅分布比较均匀,从武昌区、洪山区到江岸区、江汉区和硚口区,都分布着一定数量的热门餐厅。其中江岸区囊括了最多数量的热门餐厅。

深圳的热门餐厅主要分布在西部的宝安区、南山区和福田区,其次是龙岗区、龙华区和罗湖区。

苏州姑苏区覆盖了最多的热门餐厅,吴中区和虎丘区也包含了较多的热门餐厅。

西安的美食分布集中于中部,以雁塔区为中心向外扩散,碑林区和鄂邑区紧随其后。

重庆的也呈现了由中心向外扩散的特征,渝中区作为市中心包含了大量的热门餐厅。

从总体来看,热门美食的分布与该城市的热门商圈、市中心的分布有着十分密切的关系。而且相比于居民区,商业区聚集了更多的热门餐厅。餐厅更愿意选择在人流量多的地方开业,而人流量又很容易将一个餐厅捧为热门餐厅,也就是大家口中的网红餐厅,这两者是相辅相成的关系,因此热门餐厅多聚集于大型的商业区。但热门餐厅并不代表一定是最优质的餐厅,部分餐厅可能只是由于一时的噱头而人气暴涨或借助于地理优势吸引客户,热门餐厅与优质餐厅的关联度如何,还需要进行进一步的分析。


5.3 GDP、价格与评分的关联性分析

由于要探究GDP和人均价格,人均价格与综合评分的关系,所以我选择了可以表现事物关系的散点图作为可视化的形式。散点图可以通过轴判断出变量之间的相关性。如果变量之间不存在相互关系,那么,在散点图上就会表现为随机分布的离散的点;如果变量之间存在某种相关性,那么大部分的数据点就会相对密集并呈现出某种趋势。

可以看出,GDP和人均价格存在着正相关的关系。我一开始的假设是GDP和人均价格不存在明显的相关关系,因为国人比较注重饮食,所以在饮食的花销上差距应该不大。但是结果和我的假设相反。这说明一个城市的生产能力会影响到饮食的消费水平

通过图片可以得知,店铺的评分高低跟店铺的价格并没有十分直接的关系。人均价格在200元以上的餐厅能保持一定的质量,总评分没有低于8分的。但在人均200元以下的餐厅中,可以明显看出价格与评分不存在直接关系。因此得出结论:人均价格很高的餐厅一般质量较高,但是在中等人均价格(200元)的区间内,餐厅质量与餐厅的价格无法构成正比。


5.4 评分和价格分析

关于评分和价格分析主要分为两个部分。

第一部分是对高质量店铺和高价格店铺的比例分析。由于只需要展示某一数据在总体中的比例,所以我选择了水滴图作为可视化展现的形式。水滴图可以将某类属性的比例通过水占容器中的比例表现出来。

在设置指标时,我将人均80元作为中等偏上人均的标准,将总体评分8.5分作为优质店铺的标准。通过分析可以看出,超过半数的餐厅价格处于中等偏上的水平,而大部分餐厅属于优质餐厅。

为了探究热门餐厅的店铺质量分布,我进行了第二部分的分析:对所有餐厅的分数段比例进行分析。由于涉及到比例关系,所以我选择了饼图来呈现最后的结果。饼图可以呈现各部分在整体中的比例,能够体现部分与整体之间的关系。

可以看出,全部店铺评分都在7分以上,其中8分以上店铺占了绝大部分。由此可以对热门餐厅的总体做一个概括性的描述:大部分餐厅都处于中等消费水平以上,同时质量相对有保证,质量与热门与否之间存在着一定的正相关关系。


5.5 总体分析

对于总体的布局,我采用了各类的视觉原理,以呈现较为清晰而且较为有调理的可视化结果。

首先,为了使各类数据一目了然,我没有选择传统的拖拽浏览的布局方式,而是采用了大屏的呈现方法。这样能够让使用的人快速对所有的内容有一定的了解,并且在短时间内对自己感兴趣的内容进行定位。

其次,在对图表的布局时,我联系了格式塔原则,将相同类型的图表放在一起,将主题关联的图表放在一起,符合格式塔中的接近原则,便于使用者将相关的图表关联在一起来观看 。同时,我将结果中比较重要的内容:店铺分布地图放置在整个页面的中间,有利于使用者第一时间将视线聚焦到重点上,符合美学因素中的聚焦原则。

在颜色的搭配上,我没有采用传统的BI大屏所使用的具有科技感的黑蓝配色,而是选择了暖色系的主题。这是因为此次实验的研究内容是美食数据的可视化,食物在人们心中应该是幸福的、温暖的,所以我选择了米黄色这一让人联想到温暖的颜色作为主题颜色,同时保证其他的颜色饱和度不是太高,以营造一种温暖但又不过分兴奋的氛围。

除此之外,还采用了各种交互手段,时用户可以按照所需的展示方式修改视图展现结果。

(动态化展示结果可见结尾视频)

06 心得体会

6.1 创新与特色

本次实验的创新与特色之处有以下几点:

1、对美食的分布进行分析

对热门餐厅的美食分布进行分析,不仅有利于人们掌握各个城市美食聚集区域,形成一份美食地图,同时还可以将此地图信息与地理环境、城市规划等分析结合起来,从而进行更深入的研究。

2、对热门美食的类型进行总体和局部的分析

在其他的关于美食数据的分析中,往往有人将美食的类型进行分析,但是很少有人同时对热门美食的类型进行总体和局部的对比分析,以及不同城市的对比分析。这一分析不仅有利于我们对总体国民的饮食偏好有个总体的了解,还可以深入比较不同城市的饮食习惯共同之处和差异,同样的也可以结合对应的地理环境进行理解,并对其中可能出现的异常情况进行分析。

3、对GDP、人均价格的关联分析

对GDP和人均价格分析可以看出地区国民生产水平与消费水平特别是饮食消费水平的关系,这有利于分析国民消费结构等消费性的问题。

4、区域数据类型丰富

相比于其他只分析某个地区的数据分析而言,我结合了12个城市的数据,覆盖面较广,数据类型比较丰富,涵盖了评分、价格、地区等数据,可以挖掘出更多更深入的内容。

5、大屏展示形式

大部分的美食可视化分析并没有最后形成一个完整的结果,只是将数据形成图像后进行分析,虽然也能将分析结果叙述清楚,但是无法将图片综合起来做成一个作品。而我使用了大屏的展示形式,不仅较为清楚直观的展示我所进行数据可视化的内容,还可以给观看者一个自己与可视化视图交互的接口,同时还兼顾了视觉体验。


6.2 不足与反思

虽然这次试验我克服了很多困难,也在完成的过程中一遍遍地优化,但是还存在着一些问题:

1、数据分析的条例不够清晰

有人说数据可视化分析的过程就是用数据讲故事的过程,那么我觉得我的作品的故事线不够明晰。我认为一个好的可视化作品应该是层层递进、环环相扣的,即使对于大屏这种多样化的数据展现形式,所展现的思路也不应该是随意的堆砌,而应该是有明确的目标导向,再由这个目标分散出对应的可视化任务。但我在做这个实验时,由于所获取的数据的限制,我的思路变得有点混乱,只能将大主题定为对大众点评数据的分析,这个大主题很明显太过笼统了,这导致我后来的可视化思路变得有点凌乱,这是我未来可以改进的方向。

2、分析的深度不够

其实对于实验中的一些分析任务,我还可以广泛收集其他各类数据进行更深入的分析,比如在美食分布分析中,我可以收集各个城市的地理数据,比如人口数据、商圈数据等进行可视化的呈现,从而将分析的结果进行进一步的深入。这也是后期我继续优化作品的方向。

在这次实验中,我学到了很多。我原来以为可视化只是将信息用图像方式表现出来,在用些炫酷的效果便能做出很好的作品。然而当我真的上手实操后,我发现一切都没有那么简单。如何确定一个主题,如何捋清楚自己的思路,如何获取数据,如何在兼顾可观赏性和可理解性上做文章等,都是需要考虑的问题。这时候我就会发现自己学的知识还远远不够,所以只能在实践的过程中不断学习、不断充实自己。只有自己实打实地把整个可视化的过程做下来,才能真正了解课本中所讲的各个知识点,才能对数据可视化这一个课题有着较为全面的了解。

所以对于这个大作业,我的感想就是很充实且很幸运,虽然我还存在着很多的不足,但我也在不断完善自己,因此收获到了获得新知识地充实感。其次就是觉得拥有这个机会很幸运,可以通过这次机会做出一个属于自己的作品,真正掌握一门可视化的工具。在未来继续深入学习数据科学的路上,我相信数据可视化教给我的东西一定可以成为我的左肩右膀,为我的未来助力。

杭州珍瓒传媒

行业报白-门店认领

包通过

1.足疗按摩 2.洗浴中心 3.汗蒸温泉 

4.鲜花diy 5.spa美体 6美发美甲 

7.赛马溜冰 8.水上乐园 9.攀岩射击 

10.户外游玩11.儿童运动12. 综合商场

杭州珍瓒传媒/大众点评的美食数据分析的评论 (共 条)

分享到微博请遵守国家法律