南开大学物联网工程专业《大数据开发技术（二）》作业及答案3试题内容及答案大全-财经股

第1题、 [单选题] Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()

A.filter

B.foreach

C.map

D.mkString

答案如下：

D

第2题、 [单选题] Mllib中线性会馆算法中的参数reParam表示()

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

答案如下：

D

第3题、 [单选题] Scala列表方法中输出符号指定条件的所有元素的方法是()

A.drop

B.head

C.filter

D.init

答案如下：

C

第4题、 [单选题] Spark GraphX中类Graph的mask方法可以()

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性

D.合并边相同的属性

答案如下：

C

第5题、 [单选题] Spark中DataFrame的()方法是进行分组查询

A.order by

B.group by

C.select by

D.sort by

答案如下：

B

第6题、 [单选题] 图结构中如果无重复的边或者顶点到自身的边，那么称之为()

A.完全图

B.有向完全图

C.无向图

D.简单图

答案如下：

D

第7题、 [单选题] PairRDD中()函数可以合并具有相同键的值

A.mapValues

B.groupBy

C.groupByKey

D.reduceByKey

答案如下：

A

第8题、 [单选题] Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作，得到一个新的Dstream

A.window

B.countByWindow

C.reduceByWindow

D.reduceByKeyAndWindow

答案如下：

C

第9题、 [单选题] Scala类通过子类化和基于灵活的混合类来进行扩展，作为()的一个可靠性解决方案

A.多态

B.虚函数

C.派生

D.多重继承

答案如下：

D

第10题、 [单选题] 以下哪个函数可以对RDD进行去重()

A.sortBy

B.filter

C.distinct

D.intersection

答案如下：

C

第11题、 [单选题] PairRDD的()方法，可以把两个RDD中键相同的元素组合在一起，合并为一个RDD。

A.join

B.union

C.substract

D.intersection

答案如下：

A

第12题、 [单选题] Mllib中metrics.recallByThreshold表示()指标

A.准确度

B.召回率

C.F值

D.ROC曲线

答案如下：

B

第13题、 [单选题] Spark GraphX中类Graph的reverse方法可以()

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性

D.合并边相同的属性

答案如下：

A

第14题、 [单选题] GraphX中()方法可以释放顶点缓存

A.cache

B.presist

C.unpersistVertices

D.edges.unpersist

答案如下：

C

第15题、 [单选题] 图的结构通常表示为：G(V，E)，其中，E是图G中()

A.顶点

B.顶点的集合

C.边

D.边的集合

答案如下：

D

第16题、 [单选题] Scala中重写一个非抽象方法必须使用()修饰符。

A.extends

B.override

C.extend

D.overrides

答案如下：

B

第17题、 [单选题] GraphX中()方法可以查询度数

A.degrees

B.degree

C.vertices

D.edges

答案如下：

A

第18题、 [单选题] Mllib中线性会馆算法中的参数intercept表示()

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

答案如下：

C

第19题、 [单选题] Scala函数组合器可以对集合中的元素进行分组操作，结果得到的是一个Map的方法是()

A.filter

B.flatten

C.grouby

D.flatmap

答案如下：

C

第20题、 [单选题] Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作，返回一个内部所包含的RDD只有一个元素的新DStream

A.union

B.reduce

C.join

D.cogroup

答案如下：

B

第21题、 [单选题] 以下哪个不是Scala的数据类型()

A.Int

B.Short Int

C.Long

D.Any

答案如下：

B

第22题、 [单选题] Spark Streming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStream

A.map

B.flatMap

C.filter

D.union

答案如下：

A

第23题、 [单选题] 图是一种数据元素间为()关系的数据结构

A.多对多

B.一对一

C.一对多

D.多对一

答案如下：

A

第24题、 [单选题] 如果numPartitions是分区个数，那么Spark每个RDD的分区ID范围是()

A.[0，numPartitions]

B.[0，numPartitions-1]

C.[1，numPartitions-1]

D.[1，numPartitions]

答案如下：

B

第25题、 [单选题] Graph类中如果要根据边数据创建图，边数据需要加载为二元组，可以选择是否对边分区，应该用()方法

A.Graph(vertices，edges，defaultVertexAttr)

B.Graph.fromEdges(RDDEdge[ED]，defaultValue)

C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId，VertexId)]，defaultValue)

D.GraphLoader.edgeListFile(sc，filename)

答案如下：

C

第26题、 [多选题] Scala函数支持()

A.递归函数

B.高阶函数

C.柯里化

D.匿名函数

答案如下：

ABCD

第27题、 [多选题] 以下哪个是Scala的数据类型()

A.Any

B.NULL

C.Nothing

D.AnyRef

答案如下：

ABCD

第28题、 [多选题] Scala中可以用()方法来连接两个或多个列表

A.::

B.#:::

C.List.::()

D.List.concat()

答案如下：

BCD

第29题、 [多选题] Spark可以通过哪些外部存储创建RDD()

A.文本文件

B.目录

C.压缩文件

D.通配符匹配的文件

答案如下：

ABCD

第30题、 [多选题] Spark中的RDD的说法正确的是()

A.弹性分布式数据集

B.是Spark中最基本的数据抽象

C.代表一个可变的集合

D.代表的集合里面的元素可并行计算

答案如下：

ABD

第31题、 [多选题] Spark中DataFrame的()方法是查询指定字段的数据信息

A.select

B.selectExpr

C.col

D.apply

答案如下：

ABCD

第32题、 [多选题] 以下哪个方法可以从集合中创建RDD()

A.parallelize

B.makeRDD

C.textFile

D.loadFile

答案如下：

AB

第33题、 [多选题] TF-IDF中TF指的是()

A.词频

B.词在文档中出现的次数

C.逆文档概率

D.词在文档集中出现的概率

E.词在文档集中出现的概率

答案如下：

AB

第34题、 [多选题] Mllib实现了一些常见的机器学习算法和应用程序，包括()

A.分类

B.聚类

C.降维

D.回归

答案如下：

ABCD

第35题、 [多选题] Spark SQL可以通过()方法加载json文件为DataFrame

A.format

B.json

C.get

D.read

答案如下：

AB

第36题、 [判断题] RDD的mapPartitions操作会导致Partitions数量的变化。()

A.正确

B.错误

答案如下：

B

第37题、 [判断题] Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素。()

A.正确

B.错误

答案如下：

B

第38题、 [判断题] Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。()

A.正确

B.错误

答案如下：

B

第39题、 [判断题] Scala函数组合器中foreach和map类似，有返回值。()

A.正确

B.错误

答案如下：

B

第40题、 [判断题] Spark中DataFrame的查询操作也是一个懒操作，仅仅生成一个查询计划，只有触发Action操作才会进行计算并返回查询结果。()

A.正确

B.错误

答案如下：

A

第41题、 [判断题] PairRDD中groupBy(func)func返回key，传入的RDD的各个元素根据这个key进行分组。()

A.正确

B.错误

答案如下：

A

第42题、 [判断题] 键值对RDD由一组组的键值对组成，这些RDD被称为PairRDD。()

A.正确

B.错误

答案如下：

A

第43题、 [判断题] RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。()

A.正确

B.错误

答案如下：

B

第44题、 [判断题] RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。()

A.正确

B.错误

答案如下：

B

第45题、 [判断题] RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD，但是转换操作是懒操作，不会立刻执行计算。()

A.正确

B.错误

答案如下：

B

第46题、 [判断题] Scala函数组合器中groupBy是对集合中的元素进行分组操作，结果得到的是一个Map。()

A.正确

B.错误

答案如下：

A

第47题、 [判断题] Scala中元组是是一种可迭代的键值对(key/value)结构。()

A.正确

B.错误

答案如下：

B

第48题、 [判断题] RDD是一个可读写的数据结构。()

A.正确

B.错误

答案如下：

B

第49题、 [判断题] RDD的map操作不会改变RDD的分区数目。()

A.正确

B.错误

答案如下：

A

第50题、 [判断题] Spark只有键值对类型的RDD才能设置分区方式。()

A.正确

B.错误

答案如下：

A

南开大学物联网工程专业《大数据开发技术（二）》作业及答案3试卷及答案大全