关于大数据环境下HIVE的三种安装模式
11 2018-12-05

大数据技术hive的三种安装模式 第一种,内嵌模式 :在不修改任何配置的情况下,在本机通过默认的元数据数据库管理。 hive中有一个自带的数据库derby。 在首次启动的时候需要进行初化数据。

hive的三种安装模式

第一种,内嵌模式:在不修改任何配置的情况下,在本机通过默认的元数据数据库管理。

hive中有一个自带的数据库derby。

在首次启动的时候需要进行初化数据。因为有一些默认的表结构和默认的数据库。

schematool -initSchema -dbType derby

初始化成功之后,会在当前执行的目录下生成:metastore_db

在执行的目录的地方。运行hive。将进入hive shell窗口

mysql -uroot -p1234 mysql >

如果直接启动,将会出现Call From kd01/192.168.200.10 to kd01:9000 failed on connection exception

原因是因为hive需要连接hdfs的内容。所以在启动之前需要先启动hdfs

当有hive>时表示启动成功。

derby只能单用户操作。

derby是将所有的数据,存储在当前metastore_db的目录中的。如果在不同的目录下,多次初始化的话,将无法做到数据共享。

所以内嵌模式只适用于学习使用。

注意事项:

1、执行hive命令之前需要将hdfs启动

2、在哪一个目录下运行hive,都必须进行初始化

3、如果在同一个目录下,多次初始化时,需要将metastore_db目录删除掉,在进行初始化

第二种,本地模式:改变元数据的存放位置。(数据共享、多用户操作、速度还行)-----mysql 安装mysql-----linux中。一般情况下和hive安装在同一台主机上。

将元数据写入到mysql中,同时可以在任意目录下,执行hive,进入到hive shell窗口

让hive与mysql连接。让hive去连接mysql

修改hive中的配置文件

在hive的安装目录下,找到conf目录,将hive-default.xml.template修改为hive-site.xml

当修改的配置内容过多时,可以建议在windows中进行修改。

notepad++里面有一个自带的插件

修改内容之后,需要要将所依赖的驱动包放在指定位置下

将mysql的驱动包放在:/keduox/apache-hive-2.1.1-bin/lib/目录下 又得进行初始化操作

schematool -initSchema -dbType mysql

可以在任意目录下执行hive,也可以同时启动多个hive shell窗口

第三种,远程模式

如果我们的Hive客户端比较多,在每个客户端都安装MySQL服务还是会造成一定的冗余和浪费,这种情况下,就可以更进一步,将MySQL也独立出来,将元数据保存在远端独立的MySQL服务中。

大数据环境下hive的三种安装模式了解了吗,想学习大数据的可以在线咨询加米谷大数据的老师。

现在预报名
顶部