欢迎光临散文网 会员登陆 & 注册

Sqoop大数据开发标配

2020-07-13 16:55 作者:尚硅谷  | 我要投稿



Sqoop简介】

Sqoop(发音:skup)是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为一个Apache项目。

 

Sqoop特征

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

对于某些NoSQL数据库它也提供了连接器。Sqoop,类似于其他ETL工具,使用元数据模型来判断数据类型并在数据从数据源转移到Hadoop时确保类型安全的数据处理。Sqoop专为大数据批量传输设计,能够分割数据集并创建Hadoop任务来处理每个区块。

 

【系统学习并掌握Sqoop

尚硅谷Sqoop教程

https://www.bilibili.com/video/BV1jb411A7tc

课程详情:

Sqoop是大数据生态圈中一个数据传输工具,也是大数据工程师的一个常用工具。在本课程中,你将学习到,Sqoop的原理、安装配置、使用Oozie实现数据在Mysql与HDFS(Hive、HBase)等框架之间的互导。


Sqoop大数据开发标配的评论 (共 条)

分享到微博请遵守国家法律