欢迎光临散文网 会员登陆 & 注册

Tableau简介与数据分析出路|Tableau基本功

2022-10-11 22:54 作者:Zach正在初始化  | 我要投稿

从事数据分析工作的同学一般离不开工具三件套:Excel+SQL+一款可视化工具。

Excel是日常高频、处理小数据量的通用的最佳工具,SQL是数据库取数的常见工具,而数据可视化工具则是将规范的标准的数据加工成美观的图表的手段,一般意义上指的是PowerBI、Tableau。如果有进一步岗位需求,比如大数据处理、高级建模或者机器学习,Python、R等也是需要掌握的。

这些工具的使用确实能大大提高工作产出效率,但学习曲线和学习成本却有所差异。就我而言,三件套已经能满足日常所需,而Tableau是近几年数据分析工具学习中ROI比较高的一款。

我最早接触Tableau大概不晚于2018年,因为我之前也遇到了很多同学类似的问题,想找一款既能敏捷地做数据分析、图表颜值又在线的工具。在检索的过程中注意到了PowerBI和Tableau,并且随后这两款工具都深入学习过。但Tableau真正用起来还是在2019年以后,在断断续续学了几个视频教程、实际制作了几份可视化作品之后,我切实感受到Tableau带来的灵便和创造力,于是我决定将Tableau进阶提升作为年度主攻计划之一。

本着输出倒逼输入的思想,接下来我将结合自己过往和未来学习和使用Tableau的经验、心得开设“Tableau基本功”专题,希望记录自己学习和探索使用Tableau开展数据分析和可视化的过程,同时给那些对Tableau感兴趣的同学一些参考和指引,欢迎关注、点赞、收藏、转发。

今天是Tableau基本功专题的第一篇,主要介绍Tableau的历史、产品以及产品特点。

Tableau是什么

Tableau是当今数据科学和商业智能(BI)专业人士使用率较高的数据可视化工具之一。

根据权威评级Gartner魔力象限(Gartner® Magic Quadrant™ for Analytics and Business Intelligence Platforms),Tableau自2013年连续位居魔力象限分析和商业智能平台的领导者位置,同处在领导者区间的还有微软的PowerBI以及追赶者Qlik。

2022Gartner魔力象限

所谓商业智能(BI),根据Tableau官网的介绍:

Business intelligence combines business analytics, data mining, data visualization, data tools and infrastructure, and best practices to help organizations make more data-driven decisions

商业智能结合商业分析、数据挖掘、数据可视化、数据工具和设施以及最佳实践帮助企业产出更多数据驱动的决策

而根据维基百科的定义:

Business intelligence (BI) comprises the strategies and technologies used by enterprises for the data analysis and management of business information.

商业智能是企业为了数据分析和商业信息管理所使用的策略和技术

而我认为更加直观和准确的定义来自于博主Josh Fruhlinger:

Business intelligence (BI) leverages software and services to transform data into actionable insights that inform an organization’s strategic and tactical business decisions

商业智能借助于软件和服务将数据转化为可执行的洞见以辅助企业制定战略和策略性的商业决策。

Tableau作为一款商业智能软件整合了数据管理、数据清洗、数据分析、数据可视化、数据预测等等数据分析过程,通过自助式和敏捷的手段高效传递数据信息、辅导商业决策。

因为其简单的拖拉拽的轻便操作、高颜值的图表视觉以及灵活的交互,Tableau受到来自世界各国数据爱好者的喜爱,目前是国外企业首选的、与PowerBI并列的数据和处理分析工具。

Tableau简史

Tableau 的创始人 Christian Chabot,Chris Stolte 和 Pat Hanrahan (从左到右)


Tableau最初来自斯坦福大学教授Pat Hanrahan指导的在读博士( PhD candidate)Chris Stolte,Chris Stolte的博士答辩作品原型(prototype PhD system)(大概就是Chris Stolte和导师Pat Hanrahan在2000年还合著的一篇论文《Polaris: A System for Query, Analysis and Visualization of Multi-dimensional Relational Databases》所提及的Polaris系统)就是后来的Tableau雏形,其核心创新是发明了一个叫做 VizQL 的领域特定语言(domain-specific language ),它将数据的查询和数据可视化编码结合起来,这也是后来的Tableau成功的基础和后续创新的主要来源。

Chris Stolte 在加拿大西蒙菲莎大学(Simon Fraser University,又名西蒙弗雷泽大学,简称SFU)取得本科学位,毕业后做过数据库的软件工程师,直到成为Pat Hanrahan教授的博士生。

Pat Hanrahan是斯坦福大学计算机图形领域的全职教授,他曾经是动画公司皮克斯的早期员工,因图形渲染方面的贡献获得奥斯卡奖。

Christian Chabot在斯坦福大学获得工商管理硕士学位,早些时候与Chris Stolte合伙创业做自动生成地图帮助人们导航,他在2003年参加了 Chris 的论文答辩。

2003年,三位来自斯坦福大学的数据库和图形处理方面的爱好者和专家正式创立了Tableau。

2004年,Tableau 获得了A轮融资,还与数据库公司 Hyperion 签订了首份 OEM 合同;

2005年4月,Tableau V1.0版本发布;

2007年11月,发布企业数据共享和管理平台Tableau Server;

2008年,第一届Tableau Conference大会召开;

2010年,创始人曾认真地考虑以2.5亿美元卖掉Tableau公司;

2010年2月,免费产品Tableau Public问世,它允许学生、博主、数据新闻记者在网页上分享数据可视化作品,Tableau Public社区以及之前的Tableau Conference大会大大地推动了Tableau社区的增长。

2013年3月发布云产品Tableau Online;

2013年5月Tableau公司在纽交所IPO上市,股票代码DATA;

2018年6月,Tableau公司收购Empirical Systems,这是一家来自麻省理工学院概率计算实验室(Probabilistic Computing Project)的人工智能初创公司,其自动化统计分析技术可被集成到 Tableau 平台;

2019年6月,Tableau公司被全球SaaS行业巨头、美国客户关系管理(CRM)软件服务商Salesforce 以 157 亿美元收购,三位创始人退出;

2021年3月,发布Einstein Discovery功能,加速在机器学习方面的探索;

Tableau产品线

Tableau产品线


基于网络资料,Tableau目前主要的产品如上图所示。

其中,我们个人用户使用的主要是桌面版Tableau Desktop以及Tableau可视化分享社区Tableau Public。企业用户会用到数据清洗工具Tableau Prep以及数据管理平台Tableau Server等。

如果不是特别说明,以后提到Tableau主要指的是桌面端Tableau Desktop。

好在无论是在在Windows系统还是Mac系统,Tableau都可以使用。在这一点上,PowerBI就不行了,PowerBI因为是微软家的,只能在Windows电脑使用。

Tableau产品特点

根据我个人使用Tableau的一些经验,Tableau在我们日常从事数据分析工作主要有以下特点或优点:

•         入门容易。Tableau新人完全可以不到一小时就能掌握Tableau基本操作,如果能良好的SQL知识,那就更能加快对Tableau的理解。使用久了你会发现,Tableau与SQL底层是那么像;

•         操作简单,鼠标拖拉拽就能轻松完成,所见即所得。你不必像Excel一样复制粘贴或者写很复杂的编程语言,鼠标拖拉拽就能做出美观的基本图表;

•         贯穿数据全流程。Tableau Desktop可以实现数据连接、数据简单清洗、数据计算、数据分析、数据可视化、数据报告(数据看板dashboard、数据演示story)以及数据分享集于一端,这大大便利了日常的数据分析工作;

•         图表颜值高,吊打市面上一众数据分析和可视化工具。这一点也是很多人选择Tableau的原因之一,其符合商务和传播场景的图表让人赏心悦目;

•         激发无限创意创作能力。Tableau基本图表已经满足了日常所需,但那些富有想象力和创作激情的艺术家可以借助Tableau创作出美轮美奂的可视化作品,这大大丰富了Tableau的表现场景,不信你去Tableau Public社区逛一逛;

以上特点正是得益于Tableau最初的数据库和数据视觉编码基因,而且,Tableau也在加码AI,相信这在以后的Tableau更新中会体现出来。

当然,就像任何一款工具都有其适用场景,Tableau也不是全能的。概括而言,Tableau具有以下不足和局限:

•         Tableau入门容易,精通难。新人可以很容易掌握Tableau基础,但要想将其发挥到游刃有余就不是容易的事,正如喜乐君所言,表计算和LOD表达式对很多新人来说就是拦路虎,另外高级互动也是一个难点。

•         Tableau不擅长数据清洗。对于不用Tableau Prep的个人用户,Tableau无法实现各种脏数据的清洗和不规范数据的整理,因此我们使用Tableau之前拿到手的得是干净和规范的数据文件。这一点上PowerBI要强很多,Power Query和M函数就是专门处理这种问题;

•         Tableau无法处理高级建模。尽管Tableau内置了简单的聚类、回归分析和预测模型,但我们日常所需要的复杂建模Tableau无法实现。同样,在这一点上PowerBI也是强项,DAX函数特别强大。当然,高级数据建模最好是借助于Python和R等专门编程工具;

尽管如上所述,Tableau依然是一款对新人很友好、学习成本低、学习ROI高的数据分析和可视化软件,不然不会长期在Gartner魔力象限领导者区间,并被全世界科技和互联网公司以及教学机构和非盈利组织采用。

Tableau前置介绍就到此为止,我已经搭建并不断在丰富选题库,后续我将不定期更新Tableau计算、基本图表、高级图表的分享,欢迎持续关注。

Tableau选题


数据分析岗位的现状与机会

最后谈一谈很多人关心的数据分析岗位的现状和前途,一点愚见,仅供参考。

如果你刷知乎互联网和数据分析相关的帖子,大概总能看到这样的问题:

•         数据分析师真实的工作是怎样的?

•         想做数据分析师都要学什么?

•         如何自学数据分析?

•         如何快速成为数据分析师?

•         产品经理如何做数据分析?

•         数据分析行业对学历的要求很高吗?

•         只做报表的数据分析有前途么?

•         只会Excel、SQL、Tableau可以做数据分析师吗?

•         数据分析人员需要掌握Excel/SQL/Tableau/Python到什么程度?

这类问题一看就是新手常见的困惑,而且这是前些年特别高频出现的问题。但是最近这两年,你往往会看到如下的问题:

•         为啥数据分析找工作这么难?

•         数据分析师是不是被炒作起来的?

•         你为什么离开数据科学(Data Science)行业?

这当然是因为近三年大环境不好导致数据分析行业供需失调的缘故,经济的困顿、企业降本增效压制了相关的headcount。不过,数据分析行业的严峻还来自于其他原因。

•         前些年数据分析岗位虚火,各类培训机构推波助澜下“人人都是数据分析师”的风潮导致大量的人在学习数据分析,有限的岗位需求迎来各种背景的求职者(不管是产品还是运营,不管是统计学相关专业还是新闻传播专业),于是从业门槛逐渐提升,从Python等工具的熟练度、算法和机器学习的掌握程度到比拼学历,行业内卷化日趋严峻。

•         多年的基础设施建设和人才培养也让一二线大厂具备了足够支撑业务发展的数据体系,许多公司和部门出现数据分析师冗余,这一定程度导致表哥表姐的出现,这些人也相应缺乏职业成就感,对数据分析岗位去魅。

•         各种轻巧的低门槛的数据分析工具、无代码产品、智能化产品、SaaS工具、私有化部署数据平台等的出现,开展数据分析变得简单。这些工具的出现推动了数据分析的普及,也解放了部分人员的双手,而且这将是大趋势。

于是我们就看到了“青十五”在《策略产品经理:模型与方法论》中提到的,目前数据分析师行业存在“职场积压”现象——在工作过程中部分工作内容被上游或下游职位替代的现象。“青十五”还指出,数据分析师面临的则是双向的职能积压。对此,他给出的建议是——数据分析师一方面需要向上游延伸,比如学习数据库等底层的数据源方面的知识,一方面也可以向下游数据应用方面发展,或者结合各种业务场景深入业务底层中去。比如,我们看到类似经营分析、商业分析、供应链分析、数据产品等岗位在求职市场需求的增加,数据分析师如果不往上游深研,那么在下游数据分析与具体业务和业务场景的结合会相当大的机会。

青十五《策略产品经理:模型与方法论》

此外,我个人的看法是,数据驱动和数据素养在国内企业实践中还不够,尤其是在大量的中小企业,喊了多年的数字化转型往往还在低水平阶段。数据文化和数据能力的代差显著存在,从一线城市到其他城市、从互联网公司到其他实体企业还存在溢出红利,时光机理论还能发挥效力。搭建数据驱动体系和设施、建设数据文化还需要相关的人才,这就是结构化的机会。但这种机会也预示着数据分析的场景、流程、地位、部门协作等与往日大厂不大一样,想往这一块发展的数据分析师应该有相应的预期和心理准备。



Tableau简介与数据分析出路|Tableau基本功的评论 (共 条)

分享到微博请遵守国家法律