Hadoop 什么是ASD?2020-03-06半瓶木阅读(988)评论(0)赞(0)本文概述 并行集合 外部数据集 RDD(弹性分布式数据集)是Spark的核心抽象。它是元素的集合, 分布在集群的各个节点上, 因此我们可以对其执行各种并行操作。 有两种创建RDD的方法: 并行化驱动程序中的现有数据 引用外部存储系统中的数据...