前言
前段时间在学习hive,之前是通过hue进行编程的,但是由于设备问题,网络连接不顺畅,使用感很不好,又不想再安装客户端了,于是学习了一下怎么在虚拟机中执行hive命令并作了简单的记录。
前期准备
启动hive
#输入用户名密码,登录hadoop⽤户
#启动集群
[hadoop@node100 hadoop]$ start-all.sh
#进⼊到hive安装⽬录
[hadoop@node100 hadoop]$ cd /opt/module/apache-hive-3.1.1-bin
#启动hive
[hadoop@node100 apache-hive-3.1.1-bin]$ hive
hive(default)>
创建数据库
#创建数据库
hive(default)> create database if not exists 数据库名;
#查看数据库
hive(default)> show databases;
在新建数据库下建表
#进入新建数据库中
hive(default)> use 新建数据库名;
#在新建数据库中建表
hive(新建数据库名)> create table 表名 (字段1 字段1数据类型,字段2 字段2数据类型,……,字段n 字段n数据类型) row format delimited fields terminated by ',';
导入数据
通过XFTP将数据文件上传至虚拟机中,教程链接
#导入数据
hive(新建数据库名)> load data local inpath '数据路径' overwrite into table 表名;
查询
#查询
hive(新建数据库名)> select 字段1,……,字段n from 表名;
关闭hive和集群
#退出hive
hive(default)> exit;
#关闭hadoop集群
[hadoop@node100 apache-hive-3.1.1-bin]$ stop-all.sh
#切换到root⽤户
[hadoop@node100 apache-hive-3.1.1-bin]$ exit
[root@node100 ~]$ poweroff
推荐
另外,推荐一篇博客《HIVE的常用操作-建库和表-插入数据》,这篇博客中对加载数据方式的介绍更加详细。
版权声明:本文为weixin_44699915原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。