Hadoop RDD持久性2020-03-06半瓶木阅读(845)评论(0)赞(0)通过将数据持久存储在操作中的内存中, Spark提供了一种方便的方法来处理数据集。在保留RDD时, 每个节点都会将其计算的所有分区存储在内存中。现在, 我们还可以在该数据集的其他任务中重用它们。 我们可以使用persist()或cache(...