搜索
才径谷 >电大网教 >南开大学 >南开大学物联网工程专业《大数据开发技术(二)》作业及答案3

南开大学物联网工程专业《大数据开发技术(二)》作业及答案3试卷及答案大全

永久免费查看
更新时间:2026-04-10

南开大学物联网工程专业《大数据开发技术(二)》作业及答案3提供该考试科目的试卷全部试题及答案大全,科目内容齐全,答案供学员学习免费使用,助力考试通关!

第2题、 [单选题] Mllib中线性会馆算法中的参数reParam表示()

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

答案如下:
D
第3题、 [单选题] Scala列表方法中输出符号指定条件的所有元素的方法是()

A.drop

B.head

C.filter

D.init

答案如下:
C
第4题、 [单选题] Spark GraphX中类Graph的mask方法可以()

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性

D.合并边相同的属性

答案如下:
C
第5题、 [单选题] Spark中DataFrame的()方法是进行分组查询

A.order by

B.group by

C.select by

D.sort by

答案如下:
B
第6题、 [单选题] 图结构中如果无重复的边或者顶点到自身的边,那么称之为()

A.完全图

B.有向完全图

C.无向图

D.简单图

答案如下:
D
第7题、 [单选题] PairRDD中()函数可以合并具有相同键的值

A.mapValues

B.groupBy

C.groupByKey

D.reduceByKey

答案如下:
A
第8题、 [单选题] Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream

A.window

B.countByWindow

C.reduceByWindow

D.reduceByKeyAndWindow

答案如下:
C
第10题、 [单选题] 以下哪个函数可以对RDD进行去重()

A.sortBy

B.filter

C.distinct

D.intersection

答案如下:
C
第12题、 [单选题] Mllib中metrics.recallByThreshold表示()指标

A.准确度

B.召回率

C.F值

D.ROC曲线

答案如下:
B
第13题、 [单选题] Spark GraphX中类Graph的reverse方法可以()

A.反转图中所有边的方向

B.按照设定条件取出子图

C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性

D.合并边相同的属性

答案如下:
A
第14题、 [单选题] GraphX中()方法可以释放顶点缓存

A.cache

B.presist

C.unpersistVertices

D.edges.unpersist

答案如下:
C
第15题、 [单选题] 图的结构通常表示为:G(V,E),其中,E是图G中()

A.顶点

B.顶点的集合

C.边

D.边的集合

答案如下:
D
第16题、 [单选题] Scala中重写一个非抽象方法必须使用()修饰符。

A.extends

B.override

C.extend

D.overrides

答案如下:
B
第17题、 [单选题] GraphX中()方法可以查询度数

A.degrees

B.degree

C.vertices

D.edges

答案如下:
A
第18题、 [单选题] Mllib中线性会馆算法中的参数intercept表示()

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

答案如下:
C
第21题、 [单选题] 以下哪个不是Scala的数据类型()

A.Int

B.Short Int

C.Long

D.Any

答案如下:
B
第23题、 [单选题] 图是一种数据元素间为()关系的数据结构

A.多对多

B.一对一

C.一对多

D.多对一

答案如下:
A
第24题、 [单选题] 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()

A.[0,numPartitions]

B.[0,numPartitions-1]

C.[1,numPartitions-1]

D.[1,numPartitions]

答案如下:
B
第25题、 [单选题] Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法

A.Graph(vertices,edges,defaultVertexAttr)

B.Graph.fromEdges(RDDEdge[ED],defaultValue)

C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId,VertexId)],defaultValue)

D.GraphLoader.edgeListFile(sc,filename)

答案如下:
C
第26题、 [多选题] Scala函数支持()

A.递归函数

B.高阶函数

C.柯里化

D.匿名函数

答案如下:
ABCD
第27题、 [多选题] 以下哪个是Scala的数据类型()

A.Any

B.NULL

C.Nothing

D.AnyRef

答案如下:
ABCD
第28题、 [多选题] Scala中可以用()方法来连接两个或多个列表

A.::

B.#:::

C.List.::()

D.List.concat()

答案如下:
BCD
第29题、 [多选题] Spark可以通过哪些外部存储创建RDD()

A.文本文件

B.目录

C.压缩文件

D.通配符匹配的文件

答案如下:
ABCD
第30题、 [多选题] Spark中的RDD的说法正确的是()

A.弹性分布式数据集

B.是Spark中最基本的数据抽象

C.代表一个可变的集合

D.代表的集合里面的元素可并行计算

答案如下:
ABD
第31题、 [多选题] Spark中DataFrame的()方法是查询指定字段的数据信息

A.select

B.selectExpr

C.col

D.apply

答案如下:
ABCD
第32题、 [多选题] 以下哪个方法可以从集合中创建RDD()

A.parallelize

B.makeRDD

C.textFile

D.loadFile

答案如下:
AB
第33题、 [多选题] TF-IDF中TF指的是()

A.词频

B.词在文档中出现的次数

C.逆文档概率

D.词在文档集中出现的概率

E.词在文档集中出现的概率

答案如下:
AB
第34题、 [多选题] Mllib实现了一些常见的机器学习算法和应用程序,包括()

A.分类

B.聚类

C.降维

D.回归

答案如下:
ABCD
第35题、 [多选题] Spark SQL可以通过()方法加载json文件为DataFrame

A.format

B.json

C.get

D.read

答案如下:
AB
第48题、 [判断题] RDD是一个可读写的数据结构。()

A.正确

B.错误

答案如下:
B
第49题、 [判断题] RDD的map操作不会改变RDD的分区数目。()

A.正确

B.错误

答案如下:
A