hive、impala、prestoDB 优缺点对比

hive
优点缺点
被广泛应用，经受时间的考验既然是基于Mapreduce，也拥有MapReduce所有缺点，包含昂贵的Shuffle操作和磁盘IO操作
运行在Mapreduce框架之上hive仍然不支持多个reduce操作group by和order by查询
非常好的支持用户自定义函数和其他竞品相比，查询速度很慢
很友好的和hbase等系统结合
cloudera impala
优点缺点
轻量快速，支持近乎实时的查询零容忍运行查询任务，如果一个节点上查询失败，整个查询都会失败
计算都在内存中完成，减少延迟和磁盘IO开销用户自定义函数不是很好的支持
PrestoDB
优点缺点
轻量快速，支持近乎实时的查询13年的new born，需要待验证
facebook内部广泛使用，扩展性和稳定性毋庸置疑现在支持hive管理的表，尽管官方称支持hbase查询，但是仍然是开发状态
自从开源依赖有强劲的发展势头不支持UDF操作
和impala同样使用分布式查询引擎，和传统的Mapreduce相比，消除了延迟和磁盘IO开销
文档完善

优点	缺点
被广泛应用，经受时间的考验	既然是基于Mapreduce，也拥有MapReduce所有缺点，包含昂贵的Shuffle操作和磁盘IO操作
运行在Mapreduce框架之上	hive仍然不支持多个reduce操作group by和order by查询
非常好的支持用户自定义函数	和其他竞品相比，查询速度很慢
很友好的和hbase等系统结合

优点	缺点
轻量快速，支持近乎实时的查询	零容忍运行查询任务，如果一个节点上查询失败，整个查询都会失败
计算都在内存中完成，减少延迟和磁盘IO开销	用户自定义函数不是很好的支持

优点	缺点
轻量快速，支持近乎实时的查询	13年的new born，需要待验证
facebook内部广泛使用，扩展性和稳定性毋庸置疑	现在支持hive管理的表，尽管官方称支持hbase查询，但是仍然是开发状态
自从开源依赖有强劲的发展势头	不支持UDF操作
和impala同样使用分布式查询引擎，和传统的Mapreduce相比，消除了延迟和磁盘IO开销
文档完善

原文链接：https://blog.csdn.net/weixin_31351409/article/details/84549573