掘金总冠军

2023-06-14 14:45 作者:闭关修炼的庸人 0人读过 | 我要投稿

NoSQL是关系型数据库。×

非关系型数据库采用的是动态结构存储数据。√

CAP原则包括一致性、可用性和分区容错性这三大要素。√

CAP理论的核心思想是即使无法保证系统的强一致性。 √

数据的一致性可根据强度分为强一致性和弱一致性两种。√

在MongoDB中，数据库存储着集合和数据表。×

MongoDB默认提供admin、local、config以及test数据库。

集合就是MongoDB的一组文档，分为一般集合和下限集合。×

文档中不能有重复的键，每个文档都有一个默认的_id键。

MongoDB支持3种数字类型（32位整数（Int32）、64位整数（Int64）和64位浮点数（Double））。

针对不同的操作系统平台，MongoDB的部署均相同。×

MongoDB中管道操作符的类型单一。×

Map-Reduce操作有两个阶段，即Map和Reduce阶段。

默认情况下，MongoDB服务启动运行时是启用用户访问权限控制的。×

Robo 3T是一个跨平台的MongoDB GUI客户端管理工具。

键值对存储数据库中的数据是以列的形式来存储数据的。×

Redis是一个开源的、高性能的、基于键值对的缓存与存储数据库。

List列表中不允许出现重复的元素。×

Hash散列只能存储一个键值对之间的映射。×

有序集合可以直接对值进行操作，而散列是通过键来查找值。

HBase起源于2006年Google发表的BigTable论文。

HBase是基于行进行存储的。×

HBase中，若有多个HMaster节点共存，则所有HMaster都提供服务。×

StoreFile底层是以HFile文件的格式保存在HDFS上。

Neo4j不支持ACID事务。×

Neo4j数据库是基于Java语言开发的。

社区版的Neo4j支持集群部署。×

Neo4j版本为4.0以上，则需要版本为1.8以上的JDK环境。×

Neo4j的数据模型是遵循属性图模型来存储和管理数据的。

Cloudera CDH是需要付费使用的。×

JobTracker是HDFS重要角色。×

在Hadoop集群中，NameNode负责管理所有DataNode。

在Hadoop1.x版本中，MapReduce程序是运行在Yarn集群之上。×

Hadoop是由Java语言开发的。

Hadoop是Java语言开发的，因此在搭建Hadoop集群时，需要为集群安装JDK环境变量。

伪分布式模式下的Hadoop功能与完全分布式模式下的Hadoop功能相同。

启动Hadoop集群服务之前需要格式化文件系统。

Hadoop存在多个副本，且默认备份数量是3。

配置Hadoop集群只需要修改core-site.xml配置文件就可以。×

Secondary NameNode是NameNode的备份,可以有效解决Hadoop集群单点故障问题.×

NameNode负责管理元数据，客户端每次读写请求时，都会从磁盘中读取或写入元数据信息并反馈给客户端。

NameNode本地磁盘保存了数据块的位置信息。×

Map阶段处理数据时，是按照Key的哈希值与ReduceTask数量取模进行分区的规则。

分区数量是ReduceTask的数量。

在MapReduce程序中，必须开发Map和Reduce相应的业务代码才能执行程序。×

Zookeeper对节点的Watch监听通知是永久性的。×

Zookeeper集群宕机数超过集群数一半，则Zookeeper服务失效。

Zookeeper可以作为文件存储系统，因此可以将大规模数据文件存在该系统中。×

ResourceManager负责监控ApplicationMaster，并在ApplicationMaster运行失败的时候重启它，因此ResouceManager负责ApplicationMaster内部任务的容错。×

NodeManager是每个节点上的资源和任务管理器。

Hadoop HA是集群中启动两台或两台以上机器充当NameNode，避免一台NameNode节点发生故障导致整个集群不可用的情况。

Hadoop HA是两台NameNode同时执行NameNode角色的工作。×

在Hadoop HA中，Zookeeper集群为每个NameNode都分配了一个故障恢复控制器，该控制器用于监控NameNode的健康状态。

Hive使用length()函数可以求出输出的数量。×

再创建外部表的同时要加载数据文件，数据文件会移动到数据仓库指定的目录下。×

Hive是一款独立的数据仓库工具，因此在启动前无需启动任何服务。×

Hive默认不支持动态分区功能，需要手动设置动态分区参数开启功能。

Hive分区字段不能与已存在字段重复，且分区字段是一个虚拟的字段，它不存放任何数据，该数据来源于装载分区表时所指定的数据文。

Flume Agent是一个JVM进程，它承载着数据从外部源流向下一个目标的三个核心组件是Source、Channel和Sink。

Taildir Source用于观察指定的文件，可以实时监测到添加到每个文件的新行，如果文件正在写入新行，则此采集器将重试采集它们以等待写入完成。

Flume采集方案的名称.位置以及sources、channels、sinks参数配置信息可以随定义.×

在整个数据传输的过程中，Flume将流动的数据封装到一个event（事件）中，它是Flume内部数据传输的基本单元。

Azkaban可以通过查看executorServerLog__*.out日志文件和logs目录下的日志文件查看Azkaban Executor服务器的启动情况。

Azkaban是对job进行调度管理的，而每一个job任务都是编写在一个文本文件中，且对文本文件没有限制。×

Azkaban要建立job之间的依赖关系需要使用command参数。×

Sqoop是关系型数据库与Hadoop之间的数据桥梁，这个桥梁的重要组件是Sqoop连接器。

Sqoop从Hive表导出MySQL表时，首先需要在MySQL中创建表结构。

--target-dir参数是指定HDFS目标目录地址，因此需要提前创建目标文件。×

三.单选

下列数据库中，哪个是最简单的NoSQL数据库？键值对存储数据库

下列说法中，关于文档存储数据库说法正确的是？文档存储数据库存储的文档可以是不同结构的

下列选项中，哪个属于列式存储数据库？HBase

下列数据库中，哪个数据库不是MongoDB默认提供的？user数据库

下列说法中，关于MongoDB文档说法正确的是？不建议自定义_id键

下列选项中，哪个属于MongoDB支持的数据类型？Enum

下列命令中，哪个可以用于创建MongoDB数据库？use

下列选项中，哪个不属于管道操作符？$and

下列说法中，关于MongoDB索引说法正确的是？索引项的排序支持有效的等值匹配和基于范围的查询操作、索引是一种特殊的数据结构，即采用B-Tree数据结构

下列选项中，哪个是Redis服务的端口号？6379

下列选项中，哪个是Redis的特点？功能丰富

下列数据库中，哪个不是键值对存储数据库？MongoDB

下列选项中，哪个不属于HBase的特点？容量小

下列选项中，HBase是利用哪个作为其文件存储系统。HDFS

HBase官方版本不可以安装在什么操作系统上？Windows

下列数据库中，哪个不是图形存储数据库？HBase

下列选项中，哪个属于Neo4j的特点？资源丰富

下列选项中，哪个不属于Neo4j应用场景？欺诈检测

以下选项中，哪个程序负责HDFS数据存储。DataNode

下列哪项通常是集群的最主要的性能瓶颈？磁盘

下面哪项是Hadoop的作者？Dough cutting

HDFS默认备份数量？3

下列描述说法错误的是？ SSH是一个软件，专为远程登录会话和其他网络服务提供安全性功能的软件。

配置Hadoop集群时，下列哪个Hadoop配置文件需要进行修改？（多选）hadoop-env.sh、 core-site.xml

Hadoop2.x版本中的数据块大小默认是多少？ 128M

关于Secondary NameNode哪项是正确？它的目的是帮助 NameNode合并编辑日志，减少NameNode启动时间

客户端上传文件的时候哪项是正确的？（多选）客户端将文件切分为多个Block，依次上传、客户端发起文件上传请求，通过RPC与NameNode建立通讯。

MapReduce适用于任意应用程序

下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是一个Map函数就是对一部分原始数据进行指定的操作。

MapReduce自定义排序规则需要重写下列那项方法compareTo()

Zookeeper启动时会最多监听2个端口

下列哪些操作可以设置一个监听器Watcher setData

下列关于zookeeper描述正确的是：无论客户端连接的是哪个Zookeeper服务器，其看到的服务端数据模型都是一致的

下列选项中那些是Hadoop2.x版本独有的进程NodeManager

下列选项描述错误的是？Hadoop HA即集群中包含Secondary NameNode作为备份节点存在。

Hive是建立在Hadoop之上的一个数据仓库

Hive查询语言和SQL的一个不同之处在于Partition操作

Hive最重视的性能是可测量性、延展性、容错性和对于输入格式的宽松匹配性

以下选项中，哪种类型间的转换是被Hive查询语言所支持的String--Double

按粒度大小的顺序，Hive数据被分为：数据库、数据表、分区、桶？

下面说法选项错误的是（多选）在一个Agent中，同一个source可以有多个channel、

在一个Agent中，同一个sink只能有1个channel

下列选项中是配置job的必要参数（多选）type、command

下列选项参数是Sqoop指令的是？(多选)import、export

下列语句描述错误的是（）Sqoop是独立的数据迁移工具，可以在任何系统上执行。

标签：

掘金总冠军

掘金总冠军的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

掘金总冠军

本文作者的其他文章

掘金总冠军的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

掘金总冠军的评论 (共条)