掘金总冠军
NoSQL是关系型数据库。×
非关系型数据库采用的是动态结构存储数据。√
CAP原则包括一致性、可用性和分区容错性这三大要素。√
CAP理论的核心思想是即使无法保证系统的强一致性。 √
数据的一致性可根据强度分为强一致性和弱一致性两种。√
在MongoDB中,数据库存储着集合和数据表。×
MongoDB默认提供admin、local、config以及test数据库。
集合就是MongoDB的一组文档,分为一般集合和下限集合。×
文档中不能有重复的键,每个文档都有一个默认的_id键。
MongoDB支持3种数字类型(32位整数(Int32)、64位整数(Int64)和64位浮点数(Double))。
针对不同的操作系统平台,MongoDB的部署均相同。×
MongoDB中管道操作符的类型单一。×
Map-Reduce操作有两个阶段,即Map和Reduce阶段。
默认情况下,MongoDB服务启动运行时是启用用户访问权限控制的。×
Robo 3T是一个跨平台的MongoDB GUI客户端管理工具。
键值对存储数据库中的数据是以列的形式来存储数据的。×
Redis是一个开源的、高性能的、基于键值对的缓存与存储数据库。
List列表中不允许出现重复的元素。×
Hash散列只能存储一个键值对之间的映射。×
有序集合可以直接对值进行操作,而散列是通过键来查找值。
HBase起源于2006年Google发表的BigTable论文。
HBase是基于行进行存储的。×
HBase中,若有多个HMaster节点共存,则所有HMaster都提供服务。×
StoreFile底层是以HFile文件的格式保存在HDFS上。
Neo4j不支持ACID事务。×
Neo4j数据库是基于Java语言开发的。
社区版的Neo4j支持集群部署。×
Neo4j版本为4.0以上,则需要版本为1.8以上的JDK环境。×
Neo4j的数据模型是遵循属性图模型来存储和管理数据的。
Cloudera CDH是需要付费使用的。×
JobTracker是HDFS重要角色。×
在Hadoop集群中,NameNode负责管理所有DataNode。
在Hadoop1.x版本中,MapReduce程序是运行在Yarn集群之上。×
Hadoop是由Java语言开发的。
Hadoop是Java语言开发的,因此在搭建Hadoop集群时,需要为集群安装JDK环境变量。
伪分布式模式下的Hadoop功能与完全分布式模式下的Hadoop功能相同。
启动Hadoop集群服务之前需要格式化文件系统。
Hadoop存在多个副本,且默认备份数量是3。
配置Hadoop集群只需要修改core-site.xml配置文件就可以。×
Secondary NameNode是NameNode的备份,可以有效解决Hadoop集群单点故障问题.×
NameNode负责管理元数据,客户端每次读写请求时,都会从磁盘中读取或写入元数据信息并反馈给客户端。
NameNode本地磁盘保存了数据块的位置信息。×
Map阶段处理数据时,是按照Key的哈希值与ReduceTask数量取模进行分区的规则。
分区数量是ReduceTask的数量。
在MapReduce程序中,必须开发Map和Reduce相应的业务代码才能执行程序。×
Zookeeper对节点的Watch监听通知是永久性的。×
Zookeeper集群宕机数超过集群数一半,则Zookeeper服务失效。
Zookeeper可以作为文件存储系统,因此可以将大规模数据文件存在该系统中。×
ResourceManager负责监控ApplicationMaster,并在ApplicationMaster运行失败的时候重启它,因此ResouceManager负责ApplicationMaster内部任务的容错。×
NodeManager是每个节点上的资源和任务管理器。
Hadoop HA是集群中启动两台或两台以上机器充当NameNode,避免一台NameNode节点发生故障导致整个集群不可用的情况。
Hadoop HA是两台NameNode同时执行NameNode角色的工作。×
在Hadoop HA中,Zookeeper集群为每个NameNode都分配了一个故障恢复控制器,该控制器用于监控NameNode的健康状态。
Hive使用length()函数可以求出输出的数量。×
再创建外部表的同时要加载数据文件,数据文件会移动到数据仓库指定的目录下。×
Hive是一款独立的数据仓库工具,因此在启动前无需启动任何服务。×
Hive默认不支持动态分区功能,需要手动设置动态分区参数开启功能。
Hive分区字段不能与已存在字段重复,且分区字段是一个虚拟的字段,它不存放任何数据,该数据来源于装载分区表时所指定的数据文。
Flume Agent是一个JVM进程,它承载着数据从外部源流向下一个目标的三个核心组件是Source、Channel和Sink。
Taildir Source用于观察指定的文件,可以实时监测到添加到每个文件的新行,如果文件正在写入新行,则此采集器将重试采集它们以等待写入完成。
Flume采集方案的名称.位置以及sources、channels、sinks参数配置信息可以随定义.×
在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,它是Flume内部数据传输的基本单元。
Azkaban可以通过查看executorServerLog__*.out日志文件和logs目录下的日志文件查看Azkaban Executor服务器的启动情况。
Azkaban是对job进行调度管理的,而每一个job任务都是编写在一个文本文件中,且对文本文件没有限制。×
Azkaban要建立job之间的依赖关系需要使用command参数。×
Sqoop是关系型数据库与Hadoop之间的数据桥梁,这个桥梁的重要组件是Sqoop连接器。
Sqoop从Hive表导出MySQL表时,首先需要在MySQL中创建表结构。
--target-dir参数是指定HDFS目标目录地址,因此需要提前创建目标文件。×
三.单选
下列数据库中,哪个是最简单的NoSQL数据库?键值对存储数据库
下列说法中,关于文档存储数据库说法正确的是?文档存储数据库存储的文档可以是不同结构的
下列选项中,哪个属于列式存储数据库?HBase
下列数据库中,哪个数据库不是MongoDB默认提供的?user数据库
下列说法中,关于MongoDB文档说法正确的是?不建议自定义_id键
下列选项中,哪个属于MongoDB支持的数据类型?Enum
下列命令中,哪个可以用于创建MongoDB数据库?use
下列选项中,哪个不属于管道操作符?$and
下列说法中,关于MongoDB索引说法正确的是?索引项的排序支持有效的等值匹配和基于范围的查询操作、索引是一种特殊的数据结构,即采用B-Tree数据结构
下列选项中,哪个是Redis服务的端口号?6379
下列选项中,哪个是Redis的特点?功能丰富
下列数据库中,哪个不是键值对存储数据库?MongoDB
下列选项中,哪个不属于HBase的特点?容量小
下列选项中,HBase是利用哪个作为其文件存储系统。HDFS
HBase官方版本不可以安装在什么操作系统上?Windows
下列数据库中,哪个不是图形存储数据库?HBase
下列选项中,哪个属于Neo4j的特点?资源丰富
下列选项中,哪个不属于Neo4j应用场景?欺诈检测
以下选项中,哪个程序负责HDFS数据存储。DataNode
下列哪项通常是集群的最主要的性能瓶颈?磁盘
下面哪项是Hadoop的作者?Dough cutting
HDFS默认备份数量?3
下列描述说法错误的是? SSH是一个软件,专为远程登录会话和其他网络服务提供安全性功能的软件。
配置Hadoop集群时,下列哪个Hadoop配置文件需要进行修改?(多选)hadoop-env.sh、 core-site.xml
Hadoop2.x版本中的数据块大小默认是多少? 128M
关于Secondary NameNode哪项是正确?它的目的是帮助 NameNode合并编辑日志,减少NameNode启动时间
客户端上传文件的时候哪项是正确的?(多选)客户端将文件切分为多个Block,依次上传、客户端发起文件上传请求,通过RPC与NameNode建立通讯。
MapReduce适用于任意应用程序
下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是一个Map函数就是对一部分原始数据进行指定的操作。
MapReduce自定义排序规则需要重写下列那项方法compareTo()
Zookeeper启动时会最多监听2个端口
下列哪些操作可以设置一个监听器Watcher setData
下列关于zookeeper描述正确的是:无论客户端连接的是哪个Zookeeper服务器,其看到的服务端数据模型都是一致的
下列选项中那些是Hadoop2.x版本独有的进程NodeManager
下列选项描述错误的是?Hadoop HA即集群中包含Secondary NameNode作为备份节点存在。
Hive是建立在Hadoop之上的一个数据仓库
Hive查询语言和SQL的一个不同之处在于Partition操作
Hive最重视的性能是可测量性、延展性、容错性和对于输入格式的宽松匹配性
以下选项中,哪种类型间的转换是被Hive查询语言所支持的String--Double
按粒度大小的顺序,Hive数据被分为:数据库、数据表、分区、桶?
下面说法选项错误的是(多选)在一个Agent中,同一个source可以有多个channel、
在一个Agent中,同一个sink只能有1个channel
下列选项中是配置job的必要参数(多选)type、command
下列选项参数是Sqoop指令的是?(多选)import、export
下列语句描述错误的是()Sqoop是独立的数据迁移工具,可以在任何系统上执行。