才径谷 >电大网教 >南开大学 >南开大学物联网工程专业《大数据开发技术（二）》作业及答案4

南开大学物联网工程专业《大数据开发技术（二）》作业及答案4试卷及答案大全

永久免费查看

更新时间：2026-04-10

南开大学物联网工程专业《大数据开发技术（二）》作业及答案4提供该考试科目的试卷全部试题及答案大全，科目内容齐全，答案供学员学习免费使用，助力考试通关！

第1题、 [单选题] Spark Streming中()函数可以合并两个DStream，生成一个包含两个DStream中所有元素的新DStream对象

A.map

B.flatMap

C.filter

D.union

答案如下：

第2题、 [单选题] 请问RDD的()操作用于将相同键的数据聚合

A.join

B.zip

C.combineByKey

D.collect

答案如下：

第3题、 [单选题] Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作，得到一个新的Dstream

A.window

B.countByWindow

C.reduceByWindow

D.reduceByKeyAndWindow

答案如下：

第4题、 [单选题] Scala函数组合器可以接收一个可以处理嵌套列表的函数，然后把返回结果连接起来的方法是()

A.map

B.foreach

C.flatten

D.flatmap

答案如下：

第5题、 [单选题] GraphX中()方法可以查询边信息

A.numVertices

B.numEdges

C.vertices

D.edges

答案如下：

第6题、 [单选题] Spark Streming中()函数可以对源DStream中的每一个元素应用func方法进行计算，如果func函数返回结果为true，则保留该元素，否则丢弃该元素，返回一个新的Dstream

A.map

B.flatMap

C.filter

D.union

答案如下：

第7题、 [单选题] GraphX中()方法可以查询顶点个数

A.numVertices

B.numEdges

C.vertices

D.edges

答案如下：

第8题、 [单选题] PairRDD可以通过()获得仅包含键的RDD

A.key

B.keys

C.value

D.values

答案如下：

第9题、 [单选题] Spark GraphX中类Graph的mask方法可以()

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性

D.合并边相同的属性

答案如下：

第10题、 [单选题] var a=10; for(a<-1 until 20){ println(a); }共循环了()次

A.10

B.11

C.20

D.19

答案如下：

第11题、 [单选题] Scala中合并两个数组的方法是()

A.line

B.add

C.append

D.concat

答案如下：

第12题、 [单选题] Mllib中线性会馆算法中的参数intercept表示()

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

答案如下：

第13题、 [单选题] 以下哪个函数可以对RDD进行去重()

A.sortBy

B.filter

C.distinct

D.intersection

答案如下：

第14题、 [单选题] GraphX中()方法可以查询度数

A.degrees

B.degree

C.vertices

D.edges

答案如下：

第15题、 [单选题] GraphX中()是存放着Edg对象的RDD

A.RDD[Edge]

B.EdgeRDD

C.RDD[(VertexId，VD)]

D.VertexRDD

答案如下：

第16题、 [单选题] Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是()

A.filter

B.flatten

C.grouby

D.flatmap

答案如下：

第17题、 [单选题] var a=10; do{ a+=1; } while(a20) 共循环了()次

A.9

B.10

C.11

D.12

答案如下：

第18题、 [单选题] Spark GraphX中类Graph的joinVertices方法可以()

A.收集邻居顶点的顶点Id和顶点属性

B.收集邻居顶点的顶点Id

C.向指定顶点发送信息并聚合信息

D.将顶点信息更新到图中

答案如下：

第19题、 [单选题] Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。

A.print

B.saveAsTextFiles

C.saveAsObjectFiles

D.saveAsHadoopFiles

答案如下：

第20题、 [单选题] Scala函数组合器可以通过一个函数重新计算列表中所有元素，并且返回一个相同数目元素的新列表的方法是()

A.map

B.foreach

C.flatten

D.flatmap

答案如下：

第21题、 [单选题] spark-submit配置项中()表示启动的executor数量

A.-num-executors NUM

B.-executor-memory MEM

C.-total-executor-cores NUM

D.-executor-coures NUM

答案如下：

第22题、 [单选题] Spark中运行交互式SQL查询的大规模并行查询引擎是()

A.Spark Core

B.Spark SQL

C.BlinkDB

D.Mllib

答案如下：

第23题、 [单选题] 以下哪个函数可以求两个RDD的笛卡尔积()

A.union

B.substract

C.intersection

D.cartesian

答案如下：

第24题、 [单选题] Scala源代码被编译成()字节码，所以它可以运行于JVM之上

A.Spark

B.Scala

C.Java

D.JDK

答案如下：

第25题、 [单选题] Spark GraphX中类Graph的aggregateMessages方法可以()

A.收集邻居顶点的顶点Id和顶点属性

B.收集邻居顶点的顶点Id

C.向指定顶点发送信息并聚合信息

D.将顶点信息更新到图中

答案如下：

第26题、 [多选题] 以下哪个方法可以创建RDD()

A.parallelize

B.makeRDD

C.textFile

D.loadFile

答案如下：

ABC

第27题、 [多选题] Spark DataFrame中()方法可以返回一个Array对象

A.collect

B.take

C.takeAsList

D.collectAsList

答案如下：

第28题、 [多选题] PairRDD中()函数可以进行分组

A.mapValues

B.groupBy

C.groupByKey

D.reduceByKey

答案如下：

第29题、 [多选题] MLBase包括()

A.Mllib

B.MLI

C.SparkR

D.GraphX

答案如下：

第30题、 [多选题] 决策树是()的常用算法

A.分类

B.聚类

C.降维

D.回归

答案如下：

第31题、 [多选题] Spark的RDD持久化操作有()方式

A.cache

B.presist

C.storage

D.long

答案如下：

第32题、 [多选题] Scala中可以用()方法来连接两个或多个列表

A.::

B.#:::

C.List.::()

D.List.concat()

答案如下：

BCD

第33题、 [多选题] Spark是一个()计算框架

A.快速

B.分布式

C.可扩展

D.容错

答案如下：

ABCD

第34题、 [多选题] Spark可以从()分布式文件系统中读取数据

A.HDFS

B.Hbase

C.Hive

D.Tachyon

答案如下：

ABCD

第35题、 [多选题] Spark中DataFrame的()方法是查询指定字段的数据信息

A.select

B.selectExpr

C.col

D.apply

答案如下：

ABCD

第36题、 [判断题] Scala函数组合器中flatmap结合了map和flatten的功能，接收一个可以处理嵌套列表的函数，然后把返回结果连接起来。()

A.正确

B.错误

答案如下：

第37题、 [判断题] DataFrame是一个分布式的Row对象的数据集合。()

A.正确

B.错误

答案如下：

第38题、 [判断题] Scala列表中last返回一个列表，包含除了第一个元素之外的其他元素。()

A.正确

B.错误

答案如下：

第39题、 [判断题] Spark Streaming中时间片也可称为批处理时间间隔(batch interval)，时间片是人为地对数据进行定量的标准，作为拆分数据的依据，一个时间片的数据对应一个RDD实例。()

A.正确

B.错误

答案如下：

第40题、 [判断题] PairRDD中mapValues是针对键值对(Key，Value)类型的数据中的key和Value进行Map操作。()

A.正确

B.错误

答案如下：

第41题、 [判断题] RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除。()

A.正确

B.错误

答案如下：

第42题、 [判断题] RDD中join操作最后只返回两个RDD都存在的键的连接结果。()

A.正确

B.错误

答案如下：

第43题、 [判断题] RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD。()

A.正确

B.错误

答案如下：

第44题、 [判断题] Scala中数组的第一个元素索引为1。()

A.正确

B.错误

答案如下：

第45题、 [判断题] RDD的行动操作是用于触发转换操作的操作，这个时候才会真正开始进行计算。()

A.正确

B.错误

答案如下：

第46题、 [判断题] Spark中DataFrame的查询操作也是一个懒操作，仅仅生成一个查询计划，只有触发Action 操作才会进行计算并返回查询结果。()

A.正确

B.错误

答案如下：

第47题、 [判断题] RDD的mapPartitions操作会导致Partitions数量的变化。()

A.正确

B.错误

答案如下：

第48题、 [判断题] Scala函数组合器中foreach和map类似，有返回值。()

A.正确

B.错误

答案如下：

第49题、 [判断题] 用户可以在Hadoop YARN上运行Spark。()

A.正确

B.错误

答案如下：

第50题、 [判断题] Spark持久化RDD后，在再一次需要计算该RDD时将需要重新计算。()

A.正确

B.错误

答案如下：