- hive
| 优点 | 缺点 |
|---|---|
| 被广泛应用,经受时间的考验 | 既然是基于Mapreduce,也拥有MapReduce所有缺点,包含昂贵的Shuffle操作和磁盘IO操作 |
| 运行在Mapreduce框架之上 | hive仍然不支持多个reduce操作group by和order by查询 |
| 非常好的支持用户自定义函数 | 和其他竞品相比,查询速度很慢 |
| 很友好的和hbase等系统结合 |
- cloudera impala
| 优点 | 缺点 |
|---|---|
| 轻量快速,支持近乎实时的查询 | 零容忍运行查询任务,如果一个节点上查询失败,整个查询都会失败 |
| 计算都在内存中完成,减少延迟和磁盘IO开销 | 用户自定义函数不是很好的支持 |
- PrestoDB
| 优点 | 缺点 |
|---|---|
| 轻量快速,支持近乎实时的查询 | 13年的new born,需要待验证 |
| facebook内部广泛使用,扩展性和稳定性毋庸置疑 | 现在支持hive管理的表,尽管官方称支持hbase查询,但是仍然是开发状态 |
| 自从开源依赖有强劲的发展势头 | 不支持UDF操作 |
| 和impala同样使用分布式查询引擎,和传统的Mapreduce相比,消除了延迟和磁盘IO开销 | |
| 文档完善 |
版权声明:本文为weixin_31351409原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。