刚搞完一个项目,顺便对比了下几个大数据框架...spark真的比hadoop快不少啊,之前跑个简单统计要十几分钟,现在几分钟就完事了,爽歪歪!不过内存消耗确实大,动不动就oom,调参调到头秃 hive虽然慢点但是sql语法友好,产品经理都能看懂的那种...flink的话实时处理确实牛逼,但是学习成本有点高,文档也不够完善,踩坑踩得我怀疑人生。感觉现在还是得根据业务场景选,不能盲目追新,毕竟稳定最重要嘛...大佬们觉得呢?
登录/注册