

1、单选题:
大数据的起源是( )。
选项:
A:金融
B:公共管理
C:电信
D:互联网
答案: 【互联网】
2、单选题:
机器学习的实质是( )。
选项:
A:根据现有数据,寻找输入数据和输出数据的映射关系/函数
B:衡量输入数据和输出数据的映射关系/函数的好坏
C:挑出输入数据和输出数据的最佳映射关系/函数
D:建立数据模型
答案: 【根据现有数据,寻找输入数据和输出数据的映射关系/函数】
3、单选题:
Spark支持的分布式部署方式中哪个是错误的( )。
选项:
A:Spark on local
B:spark on mesos
C:standalone
D:spark on YARN
答案: 【Spark on local】
4、多选题:
以下表述正确的是:( )
选项:
A:人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。
B:深度学习是机器学习的一种。
C:机器学习指机器有学习的能力,是人类达成人工智能目标的手段。
D:人工智能是人们长远以来的目标,期待机器像人一样有智慧。
答案: 【人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。;
深度学习是机器学习的一种。;
机器学习指机器有学习的能力,是人类达成人工智能目标的手段。;
人工智能是人们长远以来的目标,期待机器像人一样有智慧。】
5、多选题:
有效抑制机器学习过拟合的方法是( )
选项:
A:减少数据量。
B:加大数据量。
C:平滑损失函数。
D:重新设计损失函数,引入平滑函数。
答案: 【加大数据量。;
平滑损失函数。;
重新设计损失函数,引入平滑函数。】
6、多选题:
下面表述正确的( )
选项:
A:迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。
B:监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。
C:监督学习指训练集所有输入数据都有相应输出数据与之对应。
D:强化学习指只有评价性输出结果的机器学习。
答案: 【迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。;
监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。;
监督学习指训练集所有输入数据都有相应输出数据与之对应。;
强化学习指只有评价性输出结果的机器学习。】
7、多选题:
关于Spark中的RDD描述正确的( )
选项:
A:Destributed:分布式,可以并行在集群计算。
B:RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。
C:Resilient:表示弹性的,弹性表示。
D:Datset:就是一个集合,用于存放数据的。
答案: 【Destributed:分布式,可以并行在集群计算。;
RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。;
Resilient:表示弹性的,弹性表示。;
Datset:就是一个集合,用于存放数据的。】
8、判断题:
大数据的定义是不唯一的,从不同的角度对大数据都会有不同的理解。( )
选项:
A:对
B:错
答案: 【对】
9、判断题:
关系抽取一般在实体抽取任务之后,用于抽取两个实体之间的句间关系。( )
选项:
A:对
B:错
答案: 【错】
10、判断题:
Spark的四大组件为Spark Streaming、Mlib、Graphx、Spark R。( )
选项:
A:对
B:错
答案: 【错】
备案号:冀ICP备20010840号 2020-2099辉辉网络科技 All Rights Reserved