Hue 是一个开源的 Apache Hadoop UI 系统,由 Cloudera Desktop 演化而来,最后 Cloudera 公司将其贡献给 Apache 基金会的 Hadoop 社区,它是基于 Python Web 框架 Django 实现的。通过使用 Hue 我们可以在浏览器端的 Web 控制台上与 Hadoop 集群进行交互来分析处理数据,例如操作 HDFS 上的数据、运行 MapReduce Job、执行 Hive 的 SQL 语句和浏览 HBase 数据库等。
使用 Hue 组件管理工作流时,请先登录 Hue 控制台页面,具体步骤如下:
注意:EMR-V2.5.0及以前版本、EMR-V3.1.0及以前版本未集成 OpenLDAP ,需要在首次以 root 帐号登录 Hue 控制台,参考 社区官方文档 于 WebUI 新建帐号。EMR 产品的组件启动帐号为 hadoop,历史版本建议首次登录 Hue 控制台后,新建 hadoop 帐号,后续可以通过 hadoop 帐号来提交作业。
Hue 支持4种导入方式:本地文件、HDFS 上的文件、外部数据库以及人工导入。
单击右侧的 Jobs标签,即可进入任务管理页面,单击上方的各个任务类型标签,可进行查看管理。
本页内容是否解决了您的问题?