Apache Superset 是一个数据浏览和可视化 Web 应用程序。EMR 上的 Superset,原装了对 Mysql、Hive、Presto、Impala、Kylin、Druid、Clickhouse 的支持。
在浏览器地址栏中输入http://${master_ip}:18088
(或者通过 EMR 控制台 > 集群服务), 打开 Supserset 登录界面,默认用户名为 admin,密码为您创建集群时的密码。
进入 Sources > Databases 界面,单击 Filter List。
进入如下页面,在 SQLAlchemy URI 中加入您需要添加的组件的 URI。
各个数据库的链接 SQLAlchemy URI 如下:
名称 | SQLAlchemy URI | 备注 |
---|---|---|
Mysql | mysql+pymysql://<mysqlname>:<password>@<mysql_ip>:<mysql_port>/<your_database> |
| Hive | `hive://hadoop@<master_ip>:7001/default?auth=NONE` | Master_ip:EMR 集群的 master_ip |
| presto | presto://hive@<master_ip>:9000/hive/<hive_db_name>
|
impala://<core_ip>:27000
| core_ip:EMR 集群中的 core ip |kylin://<kylin_user>:<password>@<master_ip>:16500/<kylin_project>
| clickhouse://<user_name>:<password>@<clickhouse-server-endpoint>:8123/<database_name>
| clickhouse://default:password@localhost:8123/default
Superset 支持 Database。如果您需要安装其他的数据库,可通过如下操作进行:
source /usr/local/service/superset/bin/activate
。
本页内容是否解决了您的问题?