Apache Oozie 是一个开源的工作流引擎,被设计将 hadoop 生态组件的任务编排成 Workflow,然后对其进行调度、执行、监控。本文简单介绍如何在 EMR 上使用 Oozie,详细的使用文档请参考官网,另外这里建议用户通过 Hue 的图像化界面来使用 Oozie,使用文档请移步 Hue 开发文档。
已创建弹性 MapReduce(简称EMR)的 Hadoop 集群,并选择了 Oozie 服务,详情请参见 创建 EMR 集群。
在 EMR 集群中,已安装了 sharelib,所以您使用 Oozie 提交 Workflow 作业时,不需要再安装 sharelib。当然您也可以对 sharelib 进行编辑与更新,操作步骤如下:
cd /usr/local/service/oozie
tar -xf oozie-sharelib.tar.gz添加jar包到解压出的share目录下要支持的action对应的目录下bin/oozie-setup.sh sharelib create -fs hdfs://active-namenode-ip:4007 -locallib shareoozie admin --oozie http://oozie-server-ip:12000/oozie -sharelibupdate
在 oozie 的安装目录/usr/local/service/oozie,对文件 oozie-examples.tar.gz 进行解压,里面有 Oozie 支持的组件的 Workflow 示例:
tar -xf oozie-examples.tar.gz
这里以 action hive2来进行举例:
fs.defaultFS
的值。yarn.resourcemanager.ha.rm-ids
的值,非 HA 模式下为yarn.resourcemanager.address
的值。jdbc:hive2://hive2-server:7001/default
。仍然以 action hive2 来进行举例,其它的注意事项请查看 hive2目录下的 README,此处不再赘述。
fs.defaultFS
的值。yarn.resourcemanager.ha.rm-ids
的值,非 HA 模式下为yarn.resourcemanager.address
的值。jdbc:hive2://hive2-server:7001/default
。hive.server2.authentication.kerberos.principal
的值。
本页内容是否解决了您的问题?