搜索
才径谷 >电大网教 >南开大学 >南开大学物联网工程专业《大数据开发技术(二)》作业及答案4

南开大学物联网工程专业《大数据开发技术(二)》作业及答案4试卷及答案大全

永久免费查看
更新时间:2026-04-10

南开大学物联网工程专业《大数据开发技术(二)》作业及答案4提供该考试科目的试卷全部试题及答案大全,科目内容齐全,答案供学员学习免费使用,助力考试通关!

第2题、 [单选题] 请问RDD的()操作用于将相同键的数据聚合

A.join

B.zip

C.combineByKey

D.collect

答案如下:
C
第3题、 [单选题] Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream

A.window

B.countByWindow

C.reduceByWindow

D.reduceByKeyAndWindow

答案如下:
C
第5题、 [单选题] GraphX中()方法可以查询边信息

A.numVertices

B.numEdges

C.vertices

D.edges

答案如下:
D
第7题、 [单选题] GraphX中()方法可以查询顶点个数

A.numVertices

B.numEdges

C.vertices

D.edges

答案如下:
A
第8题、 [单选题] PairRDD可以通过()获得仅包含键的RDD

A.key

B.keys

C.value

D.values

答案如下:
B
第9题、 [单选题] Spark GraphX中类Graph的mask方法可以()

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性

D.合并边相同的属性

答案如下:
C
第10题、 [单选题] var a=10; for(a<-1 until 20){ println(a); }共循环了()次

A.10

B.11

C.20

D.19

答案如下:
D
第11题、 [单选题] Scala中合并两个数组的方法是()

A.line

B.add

C.append

D.concat

答案如下:
D
第12题、 [单选题] Mllib中线性会馆算法中的参数intercept表示()

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

答案如下:
C
第13题、 [单选题] 以下哪个函数可以对RDD进行去重()

A.sortBy

B.filter

C.distinct

D.intersection

答案如下:
C
第14题、 [单选题] GraphX中()方法可以查询度数

A.degrees

B.degree

C.vertices

D.edges

答案如下:
A
第15题、 [单选题] GraphX中()是存放着Edg对象的RDD

A.RDD[Edge]

B.EdgeRDD

C.RDD[(VertexId,VD)]

D.VertexRDD

答案如下:
A
第17题、 [单选题] var a=10; do{ a+=1; } while(a20) 共循环了()次

A.9

B.10

C.11

D.12

答案如下:
B
第18题、 [单选题] Spark GraphX中类Graph的joinVertices方法可以()

A.收集邻居顶点的顶点Id和顶点属性

B.收集邻居顶点的顶点Id

C.向指定顶点发送信息并聚合信息

D.将顶点信息更新到图中

答案如下:
D
第19题、 [单选题] Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。

A.print

B.saveAsTextFiles

C.saveAsObjectFiles

D.saveAsHadoopFiles

答案如下:
C
第21题、 [单选题] spark-submit配置项中()表示启动的executor数量

A.-num-executors NUM

B.-executor-memory MEM

C.-total-executor-cores NUM

D.-executor-coures NUM

答案如下:
A
第22题、 [单选题] Spark中运行交互式SQL查询的大规模并行查询引擎是()

A.Spark Core

B.Spark SQL

C.BlinkDB

D.Mllib

答案如下:
C
第23题、 [单选题] 以下哪个函数可以求两个RDD的笛卡尔积()

A.union

B.substract

C.intersection

D.cartesian

答案如下:
D
第24题、 [单选题] Scala源代码被编译成()字节码,所以它可以运行于JVM之上

A.Spark

B.Scala

C.Java

D.JDK

答案如下:
C
第25题、 [单选题] Spark GraphX中类Graph的aggregateMessages方法可以()

A.收集邻居顶点的顶点Id和顶点属性

B.收集邻居顶点的顶点Id

C.向指定顶点发送信息并聚合信息

D.将顶点信息更新到图中

答案如下:
C
第26题、 [多选题] 以下哪个方法可以创建RDD()

A.parallelize

B.makeRDD

C.textFile

D.loadFile

答案如下:
ABC
第27题、 [多选题] Spark DataFrame中()方法可以返回一个Array对象

A.collect

B.take

C.takeAsList

D.collectAsList

答案如下:
AB
第28题、 [多选题] PairRDD中()函数可以进行分组

A.mapValues

B.groupBy

C.groupByKey

D.reduceByKey

答案如下:
BC
第29题、 [多选题] MLBase包括()

A.Mllib

B.MLI

C.SparkR

D.GraphX

答案如下:
AB
第30题、 [多选题] 决策树是()的常用算法

A.分类

B.聚类

C.降维

D.回归

答案如下:
AD
第31题、 [多选题] Spark的RDD持久化操作有()方式

A.cache

B.presist

C.storage

D.long

答案如下:
AB
第32题、 [多选题] Scala中可以用()方法来连接两个或多个列表

A.::

B.#:::

C.List.::()

D.List.concat()

答案如下:
BCD
第33题、 [多选题] Spark是一个()计算框架

A.快速

B.分布式

C.可扩展

D.容错

答案如下:
ABCD
第34题、 [多选题] Spark可以从()分布式文件系统中读取数据

A.HDFS

B.Hbase

C.Hive

D.Tachyon

答案如下:
ABCD
第35题、 [多选题] Spark中DataFrame的()方法是查询指定字段的数据信息

A.select

B.selectExpr

C.col

D.apply

答案如下:
ABCD
第44题、 [判断题] Scala中数组的第一个元素索引为1。()

A.正确

B.错误

答案如下:
B
第49题、 [判断题] 用户可以在Hadoop YARN上运行Spark。()

A.正确

B.错误

答案如下:
A