"parameter": {"datasource": "abc","column": ["id","\\"123Test\\"", //添加转义符],"where": "","splitPk": "id","table": "public.wpw_test"}
参数 | 说明 |
数据来源 | 可用的 PostgreSQL 数据源。 |
库 | 支持选择、或者手动输入需读取的库名称 默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。 当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
Schema | 支持选择、或者手动输入需读取的 Schema 名称。 |
表 | 支持选择、或者手动输入需读取的表名称 分表情况下,可在 PostgreSQL 源端支持选择或输入多个表名称,多个表需保证结构一致。 分表情况下,支持配置表序号区间。例如'table_[0-99]'表示读取'table_0'、'table_1'、'table_2'直到'table_99' ; 如果您的表数字后缀的长度一致,例如'table_000'、'table_001'、'table_002'直到'table_999',您可以配置为'"table": ["table_00[0-9]", "table_0[10-99]", "table_[100-999]"]' 。 当数据源网络不联通导致无法直接拉取表信息时,可手动输入表名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
添加分库分表 | 适用于分库场景,单击后可配置多个数据源、库及表信息。 注意:
分库分表情况下选择的多个表对象需保证 Schema 信息一致(包括字段名称、字段类型)。数据字段模块内系统默认展示第一个数据源的第一张表的元数据字段信息,若多表间字段不一致可能会导致运行失败。 |
切割键 | 您可以将源数据表中某一列作为切分键,建议使用主键或有索引的列作为切分键,仅支持类型为整型的字段。读取数据时,根据配置的字段进行数据分片,实现并发读取,可以提升数据同步效率。 |
筛选条件(选填) | PostgreSQL 根据指定的 where 条件拼接 SQL,并根据该 SQL 进行数据抽取。例如测试时,可以将 where 条件指定实际业务场景,通常会选择当天的数据进行同步,将 where 条件指定为 id>2 and sex=1。 |
参数 | 说明 |
数据去向 | 需要写入的 PostgreSQL 数据源。 |
库 | 支持选择、或者手动输入需写入的库名称 默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。 当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
Schema | 支持选择、或者手动输入需读取的 Schema 名称。 |
表 | 支持选择、或者手动输入需写入的表名称 当数据源网络不联通导致无法直接拉取表信息时,可手动输入表名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
是否清空表 | 在写入该 PostgreSQL 数据表前可以手动选择是否清空该数据表。 |
写入模式 | PostgreSQL写入支持两种模式:
append:追加写入。
upsert:根据设置主键字段进行数据更新写入。 |
批量提交大小 | 一次性批量提交的记录数大小,该值可以极大减少数据同步系统与 PostgreSQL 的网络交互次数,并提升整体吞吐量。如果该值设置过大,会导致数据同步运行进程 OOM 异常。 |
前置 SQL(选填) | 执行同步任务之前执行的 SQL 语句,根据数据源类型对应的正确 SQL 语法填写 SQL,例如,执行前清空表中的旧数据(truncate table tablename)。 |
后置 SQL(选填) | 执行同步任务之后执行的 SQL 语句,根据数据源类型对应的正确 SQL 语法填写 SQL,例如,加上某一个时间戳alter table tablename add colname timestamp DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP。 |
PostgreSQL 数据类型 | 内部类型 |
smallint(int2),integer(int4),bigint(int8), serial,bigserial | Long |
real(float4),double precision(float8), money, numeric | Double |
varchar(character varying), char,uuid,json,array | String |
date, time, timestamp | Date |
bool(boolean),bit | Boolean |
bytea | Bytes |
内部类型 | PostgreSQL 数据类型 |
Long | smallint(int2),integer(int4),bigint(int8) |
Double | double precision,numeric, real |
String | varchar(character varying),char,bit,money |
Date | date, time, timestamp |
Boolean | bool(boolean) |
Bytes | bytea |
本页内容是否解决了您的问题?