类型 | 版本 |
Hive | 1.x, 2.x, 3.x |
参数 | 说明 |
数据去向 | 选择需要同步的目标数据源。 |
写入模式 | Append:追加模式写入数据表(当前仅支持此模式)。 |
库/表匹配策略 | Hive 中数据库以及数据表对象的名称匹配规则: 默认与来源库/来源表同名。 自定义:支持使用内置参数和字符串组合生成目标库表名称。 说明: 示例:如来源表名称为 table1,映射规则为 ${table_name_di_src}_inlong,则 table1 的数据将被最终映射写入至 table1_inlong 中。 |
目标库分区规则 | 系统时间分区: 时间粒度:单选,用户可选择四种时间格式:YYYYMMDD、YYYYMM、YYYY、YYYY-MM-DD HH。 指定字段分区: 时间粒度:单选,用户可选择四种时间格式:YYYYMMDD、YYYYMM、YYYY、YYYY-MM-DD HH。 分区字段名称:输入框,用户可输入作为分区字段的字段名称。此处必须是时间类型的字段。 不分区:不做分区处理。 |
参数 | 说明 |
数据去向 | 需要写入的 Hive 数据源。 |
库 | 支持选择、或者手动输入需写入的库名称。 默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。 当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
表 | 支持选择、或者手动输入需写入的表名称。 当数据源网络不联通导致无法直接拉取表信息时,可手动输入表名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
写入模式 | Hive 仅支持 Append 写入 |
高级设置 | 可根据业务需求配置参数。 |
参数 | 说明 |
数据源 | 选择当前项目中可用的 HIVE 数据源。 |
库/表 | 选择该数据源中对应的库表。 |
写入模式 | Hive 仅支持 Append 写入。 |
高级设置(可选) | 可根据业务需求配置参数。 |
内部类型 | Hive 类型 |
CHAR(p) | char(p) |
VARCHAR(p) | varchar(p) |
STRING | string |
BOOLEAN | boolean |
TINYINT | tinyint |
SMALLINT | smallint |
INT | int |
BIGINT | bigint |
FLOAT | float |
DOUBLE | double |
DECIMAL(p, s) | decimal(p, s) |
DATE | date |
TIMESTAMP | timestamp(9) |
BINARY | bytes |
LIST | array |
MAP | map |
STRUCT | row |
本页内容是否解决了您的问题?