多易 HIVE从入门到熟练掌握
什么是Hive
由 Facebook 开源用于解决海量结构化日志的数据统计工具。
Hive 是基于 Hadoop 的一个数据仓库工具,可以将<font color=green>结构化的数据文件</font><font color=red>映射</font>为一张<font color=red>表</font>,并 提供<font color=apple green>类 SQL 查询功能</font>。
简单理解
我们可以将Hive理解为一个客户端工具,其提供了一种类SQL查询语言,称为 HiveQL。
这使得Hive十分适合数据仓库的统计分析,能够轻松使用HiveQL开启数据仓库任务,如提取/转换/加载(ETL)、分析报告和数据分析。
Hive不仅可以分析HDFS文件系统中的数据也可以分析其他存储系统,例如HBase。