分类 - Code

在RDD持久性方面，spark中的cache()和persist()有什么区别?

2025-01-03 09:00:03

我读了集群模式概述，我仍然不能理解Spark独立集群中的不同进程和并行性。worker是否是JVM进程?我运行bin\start-slave.sh，发现它生成了worker，它实际上是一个JVM。根据

2024-11-18 09:50:51

根据Learning Spark请记住，重新划分数据是一项相当昂贵的操作。Spark还有一个repartition()的优化版本，称为coalesce()，它允许避免数据移动，但仅当您正在减少RDD分

2024-11-18 14:06:33

我试图了解ZooKeeper，它是如何工作的，它是做什么的。有没有什么应用程序可以与ZooKeeper相媲美?如果你知道，那么你会如何向外行描述ZooKeeper ?我试过apache wiki, z

2024-11-18 14:07:59

缓存和持久化的区别是什么?