数仓开发工具可选用DBeaver或者DataGrip。两者都需要用到JDBC协议连接到Hive,故需要启动HiveServer2。
DataGrip下载链接如下:
https://www.jetbrains.com/datagrip/download
1. 启动HiveServer2
[muzili@hadoop102 hive]$ hiveserver2
2. 配置DataGrip连接
1)创建连接
DataGrip支持主流的数据库,File -> New -> DataSource
或在Database视图中展开 + 号,添加数据库连接
放大图:
2)配置连接属性
所有属性配置,和Hive的beeline客户端配置一致即可。初次使用,配置过程会提示缺少JDBC驱动,按照提示下载即可。
以hive为例:
在线安装数据库驱动,点击Driver:Apache Hive
进入如下页面,点击Download ver.3.1.2
也可以选择其他版本:点击右边 + ,选择Provided Driver,选择你需要的库类型,我选的是hive,如图会提供相应的版本供选择。
下载中:
下载驱动完成:
输入主机名(Host)、端口(Port)、用户名(User)、密码(Password)。点击下面的Test Connection就可以测试链接或直接点击?进行链接。
同时也可以在如下目录中找到下载的jdbc-drivers
4)离线安装数据库驱动
遇到的问题:DataGrip 默认不带数据库驱动程序,如果你要连接到指定的数据库,它默认是现场联网下载的。这也就意味着,如果你想要在内网里使用 DataGrip,你必须要摸索一条离线安装数据库驱动的方法。
在线下载驱动jar,复制jar到内网离线环境。
拷贝数据库驱动文件到当前用户 .DataGrip2019.2\config\jdbc-drivers
路径下,将我们的数据库驱动文件夹拷贝进去。
方式一:
重启 DataGrip,左侧的 Database 标签页 -> +
按钮 -> Driver and Data Source ,选中指定数据库类型,点击 Switch to ver. xxx 即可
方式二:
创建连接,点击驱动。
点击Driver files右侧的 + ,选择的自定义jar(Custom JARs)
选择你拷贝的驱动的jar,如下图。
Apply,驱动就应用了。
3. 测试使用
1)创建数据库
创建数据库gmall,并观察是否创建成功。