试题详情
- 多项选择题spark的源码是由哪几种语言编写完成的()
A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
关注下方微信公众号,在线模考后查看

热门试题
- 对集(Set)进行操作"Set(2,?0
- 下面那些属于转化算子?()
- 在scala中如果方法没有返回值,则需要
- 大数据计算原则是()
- sample(withReplaceme
- Rdd不能够转换成DataFrame
- 下面那些对于lazy关键字说法正确的选项
- 以下哪些不是rdd的特性()
- 有关插值器说法如下不正确的是()
- 以下哪些属于动作算子()
- DataFrame支持如下那种风格()
- 该方法被称为cons,意为构造,向队列的
- 下列哪个选中可以在Scala中在map操
- spark中action算子的作用()
- scala中String类没有插值器的概
- RDD(ResilientDistrib
- 以下选项属于rdd特性的是()
- 和spark中执行算子相对应的那个()
- reduceRight通过如下程序块其输
- flume由以下哪个公司开发的组件()