欢迎光临散文网 会员登陆 & 注册

CDA-LEVELⅡ错题分享

2023-05-05 18:19 作者:恨不因斯坦  | 我要投稿

1.下列关于多元回归方程中的变量说法不正确的是?

A.典型的非线性变换包括自然对数,平方根,倒数和平方

B.互动变量表示两个变量之间存在交互作用,在方程中常体现为两者之和

C.创建虚拟/哑变量(dummy variables)可以将定性的变量量化

D.如果一个定性变量中有m种互斥的属性类型,在模型中需要引入m-1个虚拟/哑变量

B互动变量表示两个变量之间存在交互作用,在方程中体现为两者之积。

 

2.不属于消除模型异方差的方法是?
A.加权最小二乘法
B.等级相关系数法
C.方差稳定性变化法
D.Box-Cox变换法
B选项的等级相关系数法是用来检验是否存在异方差的,而不是用来消除异方差的,故错误

 

3.含有p个变量的多元回归模型,样本量为n,则该模型的回归平方和、残差平方和的自由度分别为?
A.p,n-p
B.n-p,p
C.p,n-p-1
D.n-p-1,p
C

 

 

4.以下哪个模型是对线性趋势预测的模型
A.简单指数平滑
B.Holt指数平滑
C.指数模型
D.多项式模型
B
A用于随机序列的预测。C也称指数曲线,用于非线性趋势。D项多项式函数用于非线性趋势的预测

 

 

5.如果时间序列同时含趋势、季节变动和随机波动成分时,除了可以使用Witer指数平滑模型预测外,还可以使用什么方法/模型进行预测?
A.Holt指数平滑
B.简单指数平滑
C.分解法
D.以上都不是
C分解法是把趋势、季节成分分解出来,单独进行分析再乘在一起。

 

 

 

6.在问题原因分析中,需要找到多个因素之间难以识别的关系,适合用什么工具?

A.散点图

B.调查表

C.关联图

D.柱状图

C

散点图用于找到两个变量间的关系,不是多个因素,多个指三个以上(包括三个);调查表用于从采访者那里收集数据,在问题原因数据收集会涉及到;关联图是以一种清晰的图示,揭示找出多个因素间的关系,主要目的是识别那些不易被发现的关系;柱状图主要用于图形描绘数据;

 

 

 

7.下列哪个选项属于根因分析中鱼骨图创建图形的方式?
A.分散分析法
B.因果分析法
C.五问法
D.因子分析法
A
鱼骨图包括两种明显不同的创建图形的方式:分散分析法、原因枚举法

 

8.根因分析的因果图(鱼骨图)绘制过程中,要解决的问题或缺陷(后果)标记在‘鱼’的哪个部位?
A.鱼尾
B.鱼头
C.鱼刺
D.以上均可
B鱼头是标记要解决的问题或缺陷(后果),鱼刺列出的是产生问题的可能原因,有助于说明各个原因是如何影响后果的

 

 

9.在根因分析的因果图中,若各要素与特性值间不存在原因关系,而是结构构成关系属于哪种类型因果图?
A.原因型
B.对策型
C.整理问题型
D.结果导向型
C整理问题型鱼骨图适用于:各要素与特性值间不存在原因关系,而是结构构成关系

 

 

10.根因分析中为弄清一个层面的原因对另一个层面的原因影响后,探求原因链应该采用的量化分析工具是?
A.散点图
B.柱状图
C.帕累托图
D.关联图
A在根因分析中散点图的应用表现:第一是在弄清一个层面的原因对另一个层面的原因的影响后,探求原因链。第二是剔除那些与根原因不相关的原因

 

 

11.关于根原因识别工具关联图的说法错误的是?

A.包括质量关联图和数量关联图

B.质量关联图可能会带来不可靠的结果

C.数量关联图的结构性更强

D.质量关联图优于数量关联图

D关联图有质量关联图和数量关联图两类,基本原则都是识别不同因素间的关系,区别于方法的不同。在质量关联图中,要分析的因素被画在一个空白图表上,凭借直观理解把因素联系起来就可以找到关系,因此质量关系图可能会带来不可靠的结果。而在数量关联图中,在确定不同因素之间关系的时候往往需要使用简单的数字方法,所以数量关联图的结构性更强,分析过程更完善。数量关联图优于质量关联图。

 

 

12.关于线性规划的标准型描述正确的是?

A.目标函数为极小化类型

B.所有的约束条件都是不等式

C.等式约束方程右端的常数都是非零的

D.所有决策变量都是非负的

D线性规划模型的标准形式的特征:(1)目标函数为极大化类型;(2)所有的约束条件都是等式;(3)所数学规划有约束方程右端的常数都是非负的;(4)所有决策变量都是非负的

 

 

 

13.常用的求解整数规划的方法不包括以下哪种?
A.分支定界法
B.分配法
C.割平面法
D.隐枚举法
B整数规划的方法不包括分配法

 

 

 

14.下列方法中不属于常用的二次规划问题求解方法是?
A.拉格朗日法
B.内点法
C.椭球法
D.分支定界法
D分支定界法是整数规划的求解方法

 

 

15信息一般认为由那两部分组成
A.数据
B.元数据
C.加工过程
D.描述对象
AB信息由数据和元数据构成

 

 

 

 

 

 

 

 

16.在进行随机抽样时由于某些原因会产生抽样误差,以下关于抽样误差的说法,正确的是

A.抽样误差是随机抽样调查中偶然发生的代表性误差

B.抽样误差的大小同样本单位数成正比关系

C.简单随机抽样比分层、分群抽样误差大

D.重复抽样比不重复抽样误差小

A抽样误差是指由于抽样的随机性带来的偶然的代表性误差,选项A正确; 样本单位数目越多,抽样误差越小,反之则大,选项B错误; 一般来说,分层抽样误差相对简单随机抽样、分群抽样误差较小,选项C错误; 在同等条件下,重复抽样比不重复抽样误差大,重复抽样会有样本重复,信息量就小,代表性比较低

 

 

17.下面关于第三范式关系必须符合的条件,说法错误的是?
A.每个属性的值唯一
B.每个非主属性必须完全依赖于整个主键
C.其他关系的属性需要依赖于主键
D.每个非主属性不能依赖于其他关系中的属性
C暂无答案解析

增量数据ETL中捕获数据变化的方法有:触发器方式、时间戳方式、全表删除插入方式、全表比对方式、日志表方式、系统日志分析方式等。 C:datastage,Informatica属于常见的ETL工具,除此之外Spark等通用计算引擎也可用于ETL开发

 

18.ABtest是运营人员、产品经理等经常使用的工具,下面关于AB实验中最小样本量的描述正确的是()

A.预期提升比例越大,最小样本量越小

B.样本方差越大,最小样本量越小

C.选取α值越大,最小样本量越小

D.选取β值越小,最小样本量越小

A检验方案实施后的总体B是否相对实施前的总体A有显著提升。比例越大越说明B比A有显著差异,则只需越少的样本就能得出显著的结论

 

 

19.为了比较两个总体方差,我们通常检验两个总体的
A.方差差
B.方差比
C.方差乘积
D.方差和
B比较两个总体方差时,通常采用检验两个总体方差比的F检验

 

 

20.关于单因素方差分析,下列说法不正确的是

A.组间平方和只包含系统误差

B.组内平方和只包含随机误差

C.如果组间均方远大于组内均方,那么就说明不同水平之间均值存在着显著差异。

D.如果组间均方远大于组内均方,那么就说明分类变量对于数值变量有显著影响。

A组间误差包括效应间差异和随机误差,故A项错误;

 

 

21.在业务上常常需要分析两个变量之间的相关性并根据结果来制定后续的计划,度量两个连续变量的相关性可以用以下哪种指标()?

A.皮尔逊相关系数

B.斯皮尔曼相关系数

C.肯德尔曼相关系数

D.以上都可以

A相关性的度量方法:两个连续变量使用皮尔逊相关;两个顺序性变量使用斯皮尔曼相关系数;肯德尔相关系数也是秩相关系数,用于有序变量

 

 

 

22.在实际应用中,若研究单个指标的方差对结果的影响,在做主成分析的时候应该选择使用( )
A.协方差矩阵
B.相关系数矩阵
C.关联矩阵
D.其余三者皆可
A涟钢不一样用相关系数,一样则用协方差矩阵。各主成分方差之和等于所有变量x的方差之和,因此用协方差矩阵可以得到指标的方差,从而继续后续分析。

 

 

23.关于主成分分析与因子分析的区别和联系说法正确的是?

A.每个主成分都只包含部分原始变量,这些变量代表着相应主成分的明确含义

B.每个主成分都是原始变量的线性组合,因此,各主成分之间存在一定的相关性

C.因子分析需要假设各公因子之间互不相关,特殊因子之间也不相关,公因子和特殊因子之间也不相关;但是主成分分析不需要任何假设

D.公因子和主成分都不能被很好的解释

C

A.每个主成分都是所有原始变量的线性组合,且各变量的系数大小没有明确的分界线,故很难对每个主成分的含义做出解释; B.每个主成分都是原始变量的线性组合,各主成分之间相互独立; D.因子分析中,由于使用了因子旋转技术而使得因子得到更好的解释,但是对于主成分来说却很难表示出其明确的含义

 

 

24.关于因子分析的KMO检验说法错误的是( )。

A.KMO统计量是取值在0和1之间

B.当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值越接近于1

C.当KMO值接近1时,表示各变量之间的偏相关系数应该很小

D.当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值越接近于0

DKMO统计量越接近1,说明简单相关系数平方和越大于偏相关系数平方和,说明变量间的相关性越高,从而用因子分析就能更好地提出具有共同特征的因子

简单相关系数没有考虑其余变量的影响,偏相关系数考虑并控制了其他变量的影响。

 

25.为了比较两个总体方差,我们通常检验两个总体的
A.方差差
B.方差比
C.方差乘积
D.方差和
B比较两个总体方差时,通常采用检验两个总体方差比的F检验

 

26.如果回归分析中存在多重共线性,下列说法错误的是( )。

A.所求出的参数的含义将变得不合理

B.不会影响模型的预测结果

C.可用岭回归或Lasso回归降低多重共线性对回归结果的影响

D.存在多重共线性的变量所求参数将变得不显著

B多重共线性会使估计量的方差变大,则显然会让预测结果更容易不准确

 

 

 

27.可以用于趋势成分和季节成分序列的预测是哪种模型?

A.Winter模型

B.Holt模型

C.简单指数平滑模型

D.以上都不是

A

Winter模型同时含有平滑值(随机成分)和季节成分,因此可用于同时含有趋势和季节成分的预测。Holt不含季节成分,简单指数平滑不含随机成分,都不合适。

 

 

28.单纯形法是求解线性规划问题最常用、最有效的算法之一,关于单纯形法的说法正确的是

A.在线性规划问题中,只要存在相应的解,则一定可以在可行域的顶点中找到。

B.单纯形法的核心是根据一定的规则,一步步寻找可行域中的最优解。

C.对偶单纯形法是求解对偶问题的一种方法。

D.单纯形法计算精度高,并且是一种很经济的算法

B

A.只有线性规划问题的最优解存在时,才一定可以在可行域的顶点中找到; C.对偶单纯形法是使用对偶理论来求解线性规划问题的一种方法,而不是求解对偶问题的方法; D.原单纯形法以高斯消去法为基础,并不是一种很经济的算法,故产生了改进单纯形法,在减少迭代累计误差的同时也提高了计算精度

 

 

29.AR模型平稳性的判别方法有?
A.散点图
B.单位根判别法
C.平稳域判别法
D.自相关图
BCD
A选项与平稳性的判别无关,事实上时间序列的相关问题也很少使用散点图来分析

 

 

30.根据麦肯锡问题分析方法,问题的三种类型包括:
A.恢复原状型问题
B.问题解决型问题
C.防范潜在型问题
D.追求理想型问题
ACD
麦肯锡问题的三大类型:恢复原状型、追求理想型、防范潜在型


CDA-LEVELⅡ错题分享的评论 (共 条)

分享到微博请遵守国家法律