update: 2017-05-30

最近开始尝试进行Spark贡献,目前精力主要在ML部份。在反复读代码的过程中,做了些笔记资料,打算分享出来。一则自己备忘,二来也方便他人快速上手。

因为主要是自己看,代码的迭代也快,只会简要做些点注,并不会面面俱到。如果想要深而细,建议阅读Mastering Apache Spark 2