Spark, 大数据

spark-02 核心模块

  • Spark Core
    • 提供了Spark最基础与最核心的功能
  • Spark SQL
    • 是Spark用来操作结构化数据的组件
    • 通过Spark SQL 用户可以使用SQL或者Apache Hive版本的SQL(HQL)来查询数据
  • Spark Streaming
    • 是Spark平台上针对实时数据进行流式计算的组件,提供了丰富的处理数据流的API