学习笔记(03):Hive大数据离线应用开发-Hive的基本概念

立即学习:https://edu.csdn.net/course/play/24743/282495?utm_source=blogtoedu

hive其实就是一个数据仓库,大数据领域用于数据分析的引擎

HDFS(数据存放)

MapReduce(计算方式)

hive提供类SQL实现机制HSQ

hive-基于Hadoop的开源数据仓库工具,用于存储和处理海量结构化数据,通过表的方式管理数据;而实际上这些数据室分布式的存储在HDFS上的。

hive的数据处理:通过HQL完成,转换成MapReduce任务

hive其实就是一个壳(工具)

hive:可扩展性、延展性、容错性

 


版权声明:本文为qq_32439397原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。