Spark, 大数据
Posted by

spark-01 spark vs hadoop

File:数据源 Mapper:将数据读取出来并打散数据 data:数据 reducer:聚合数据 最后落盘File 上一次计算结果为下一次计算使用,磁盘IO会非常影响性能 不适合循环迭代式数据流处理 Spark改进 ...