试题详情
- 判断题RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
关注下方微信公众号,在线模考后查看

热门试题
- mapreduce是基于()运行的计算框
- flume中的agent包含四大组件分别
- flume在大数据生态圈中的作用是()
- Kafka是由哪个组织研的组件()
- 日志收集系统Flume现在使用的是哪个版
- 以下选项中是persist算子在源码中具
- 以下属于消息中间件的是哪些()
- spark架构中的的cache算子想要正
- 以下选项中运行结果和以下代码相同的是va
- kafka主要组成部分是source、s
- spark基于客户端模式运行时,driv
- 现有元组valt=(1,3.14,"Fr
- 下面算子中哪个是宽依赖的()
- spark程序无法连接和访问mysql中
- 以下关于Namenode的说法正确的是(
- maven项目打包的方式有哪几种()
- 以下关于scala语言中的函数的说法中,
- 文件exer1的访问权限为rw-r--r
- spark为分布式数据集的处理提供了一个
- flume出现java.net.Bind