最近在给一个大数据开源项目提交了个 patch,主要是优化了一下数据分区的逻辑,结果还真被合入了,第一次真正参与到真实的大数据项目里,感觉还挺有成就感的。之前老是在论坛上看别人讨论 Spark 的 Shuffle 问题,现在自己也能动手改代码了,虽然只是个小修复,但还是挺开心的,感觉离真正的数据工程师又近了一步吧...
登录/注册