欢迎光临散文网 会员登陆 & 注册

掘金总冠军

2023-06-14 14:45 作者:闭关修炼的庸人  | 我要投稿

NoSQL是关系型数据库。×                                                                                  

非关系型数据库采用的是动态结构存储数据。                                             

CAP原则包括一致性、可用性和分区容错性这三大要素。        

CAP理论的核心思想是即使无法保证系统的强一致性。               

数据的一致性可根据强度分为强一致性和弱一致性两种。√                 

在MongoDB中,数据库存储着集合和数据表。×

MongoDB默认提供admin、local、config以及test数据库。                

集合就是MongoDB的一组文档,分为一般集合和下限集合。×

文档中不能有重复的键,每个文档都有一个默认的_id键。                   

MongoDB支持3种数字类型(32位整数(Int32)、64位整数(Int64)和64位浮点数(Double))。

  针对不同的操作系统平台,MongoDB的部署均相同。×

MongoDB中管道操作符的类型单一。×

Map-Reduce操作有两个阶段,即Map和Reduce阶段。

默认情况下,MongoDB服务启动运行时是启用用户访问权限控制的。×

Robo 3T是一个跨平台的MongoDB GUI客户端管理工具。

键值对存储数据库中的数据是以列的形式来存储数据的。×

Redis是一个开源的、高性能的、基于键值对的缓存与存储数据库。

List列表中不允许出现重复的元素。×

Hash散列只能存储一个键值对之间的映射。×

有序集合可以直接对值进行操作,而散列是通过键来查找值。

HBase起源于2006年Google发表的BigTable论文。

HBase是基于行进行存储的。×

HBase中,若有多个HMaster节点共存,则所有HMaster都提供服务。×

StoreFile底层是以HFile文件的格式保存在HDFS上。

Neo4j不支持ACID事务。×

Neo4j数据库是基于Java语言开发的。

社区版的Neo4j支持集群部署。×

Neo4j版本为4.0以上,则需要版本为1.8以上的JDK环境。×

Neo4j的数据模型是遵循属性图模型来存储和管理数据的。

Cloudera CDH是需要付费使用的。×

JobTracker是HDFS重要角色。×

在Hadoop集群中,NameNode负责管理所有DataNode。

在Hadoop1.x版本中,MapReduce程序是运行在Yarn集群之上。×

Hadoop是由Java语言开发的。

Hadoop是Java语言开发的,因此在搭建Hadoop集群时,需要为集群安装JDK环境变量。

伪分布式模式下的Hadoop功能与完全分布式模式下的Hadoop功能相同。

启动Hadoop集群服务之前需要格式化文件系统。

Hadoop存在多个副本,且默认备份数量是3。

配置Hadoop集群只需要修改core-site.xml配置文件就可以。×

Secondary NameNode是NameNode的备份,可以有效解决Hadoop集群单点故障问题.×

NameNode负责管理元数据,客户端每次读写请求时,都会从磁盘中读取或写入元数据信息并反馈给客户端。

NameNode本地磁盘保存了数据块的位置信息。×

Map阶段处理数据时,是按照Key的哈希值与ReduceTask数量取模进行分区的规则。

分区数量是ReduceTask的数量。

在MapReduce程序中,必须开发Map和Reduce相应的业务代码才能执行程序。×

Zookeeper对节点的Watch监听通知是永久性的。×

Zookeeper集群宕机数超过集群数一半,则Zookeeper服务失效。

Zookeeper可以作为文件存储系统,因此可以将大规模数据文件存在该系统中。×

ResourceManager负责监控ApplicationMaster,并在ApplicationMaster运行失败的时候重启它,因此ResouceManager负责ApplicationMaster内部任务的容错。×

NodeManager是每个节点上的资源和任务管理器。

Hadoop HA是集群中启动两台或两台以上机器充当NameNode,避免一台NameNode节点发生故障导致整个集群不可用的情况。

Hadoop HA是两台NameNode同时执行NameNode角色的工作。×

在Hadoop HA中,Zookeeper集群为每个NameNode都分配了一个故障恢复控制器,该控制器用于监控NameNode的健康状态。

Hive使用length()函数可以求出输出的数量。×

再创建外部表的同时要加载数据文件,数据文件会移动到数据仓库指定的目录下。×

Hive是一款独立的数据仓库工具,因此在启动前无需启动任何服务。×

Hive默认不支持动态分区功能,需要手动设置动态分区参数开启功能。

Hive分区字段不能与已存在字段重复,且分区字段是一个虚拟的字段,它不存放任何数据,该数据来源于装载分区表时所指定的数据文。

Flume Agent是一个JVM进程,它承载着数据从外部源流向下一个目标的三个核心组件是Source、Channel和Sink。

Taildir Source用于观察指定的文件,可以实时监测到添加到每个文件的新行,如果文件正在写入新行,则此采集器将重试采集它们以等待写入完成。

Flume采集方案的名称.位置以及sources、channels、sinks参数配置信息可以随定义.×

在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,它是Flume内部数据传输的基本单元。

Azkaban可以通过查看executorServerLog__*.out日志文件和logs目录下的日志文件查看Azkaban Executor服务器的启动情况。

Azkaban是对job进行调度管理的,而每一个job任务都是编写在一个文本文件中,且对文本文件没有限制。×

Azkaban要建立job之间的依赖关系需要使用command参数。×

Sqoop是关系型数据库与Hadoop之间的数据桥梁,这个桥梁的重要组件是Sqoop连接器。

Sqoop从Hive表导出MySQL表时,首先需要在MySQL中创建表结构。

--target-dir参数是指定HDFS目标目录地址,因此需要提前创建目标文件。×

三.单选

下列数据库中,哪个是最简单的NoSQL数据库?键值对存储数据库

下列说法中,关于文档存储数据库说法正确的是?文档存储数据库存储的文档可以是不同结构的

下列选项中,哪个属于列式存储数据库?HBase

下列数据库中,哪个数据库不是MongoDB默认提供的?user数据库

下列说法中,关于MongoDB文档说法正确的是?不建议自定义_id键

下列选项中,哪个属于MongoDB支持的数据类型?Enum

下列命令中,哪个可以用于创建MongoDB数据库?use

下列选项中,哪个不属于管道操作符?$and

下列说法中,关于MongoDB索引说法正确的是?索引项的排序支持有效的等值匹配和基于范围的查询操作、索引是一种特殊的数据结构,即采用B-Tree数据结构

下列选项中,哪个是Redis服务的端口号?6379

下列选项中,哪个是Redis的特点?功能丰富

下列数据库中,哪个不是键值对存储数据库?MongoDB

下列选项中,哪个不属于HBase的特点?容量小

下列选项中,HBase是利用哪个作为其文件存储系统。HDFS

HBase官方版本不可以安装在什么操作系统上?Windows

下列数据库中,哪个不是图形存储数据库?HBase

下列选项中,哪个属于Neo4j的特点?资源丰富

下列选项中,哪个不属于Neo4j应用场景?欺诈检测

以下选项中,哪个程序负责HDFS数据存储。DataNode 

下列哪项通常是集群的最主要的性能瓶颈?磁盘

下面哪项是Hadoop的作者?Dough cutting

HDFS默认备份数量?3

下列描述说法错误的是?  SSH是一个软件,专为远程登录会话和其他网络服务提供安全性功能的软件。

配置Hadoop集群时,下列哪个Hadoop配置文件需要进行修改?(多选)hadoop-env.sh、 core-site.xml

Hadoop2.x版本中的数据块大小默认是多少? 128M

关于Secondary NameNode哪项是正确?它的目的是帮助 NameNode合并编辑日志,减少NameNode启动时间

客户端上传文件的时候哪项是正确的?(多选)客户端将文件切分为多个Block,依次上传、客户端发起文件上传请求,通过RPC与NameNode建立通讯。

MapReduce适用于任意应用程序

下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是一个Map函数就是对一部分原始数据进行指定的操作。 

MapReduce自定义排序规则需要重写下列那项方法compareTo()

Zookeeper启动时会最多监听2个端口

下列哪些操作可以设置一个监听器Watcher setData

下列关于zookeeper描述正确的是:无论客户端连接的是哪个Zookeeper服务器,其看到的服务端数据模型都是一致的

下列选项中那些是Hadoop2.x版本独有的进程NodeManager

下列选项描述错误的是?Hadoop HA即集群中包含Secondary NameNode作为备份节点存在。

Hive是建立在Hadoop之上的一个数据仓库

Hive查询语言和SQL的一个不同之处在于Partition操作

Hive最重视的性能是可测量性、延展性、容错性和对于输入格式的宽松匹配性

以下选项中,哪种类型间的转换是被Hive查询语言所支持的String--Double

按粒度大小的顺序,Hive数据被分为:数据库、数据表、分区、桶?

下面说法选项错误的是(多选)在一个Agent中,同一个source可以有多个channel、

在一个Agent中,同一个sink只能有1个channel

下列选项中是配置job的必要参数(多选)type、command

下列选项参数是Sqoop指令的是?(多选)import、export

下列语句描述错误的是()Sqoop是独立的数据迁移工具,可以在任何系统上执行。

 


掘金总冠军的评论 (共 条)

分享到微博请遵守国家法律