第一阶段:熟练的掌握Scala语言
1,Spark框架是采用Scala语言编写的,精致而优雅。要想成为Spark高手,你就必须阅读Spark的源代码,就必须掌握Scala,;
3,尤其要熟练掌握Scala的trait、apply、函数式编程、泛型、逆变与协变等;
第二阶段:精通Spark平台本身提供给开发者API
2,掌握Spark中的宽依赖和窄依赖以及lineage机制;
3,掌握RDD的计算流程,例如Stage的划分、Spark应用程序提交给集群的基本过程和Worker节点基础的工作原理等
第三阶段:深入Spark内核