课程简介 Spark是专为大规模数据处理而设计的分析计算引擎。 技术上,Spark是基于Hadoop MapReduce设计的通用并行框架,拥有其所具备的优点,并采用内存的方式优化了中间计算过程,极大提高了计算效率,从而使Spark可以更好地应用在数据挖掘与机器学习等迭代式计算场景。