streaming_load_max_mb。
streaming_load_max_mb
为16000即可。参数 | 说明 |
数据来源 | 需要同步的可用 Doris 数据源。 |
库 | 支持选择、或者手动输入需读取的库名称。 默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。 当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
表 | 支持选择、或者手动输入需读取的表名称。 |
切割键 | 指定用于数据分片的字段,指定后将启动并发任务进行数据同步。您可以将源数据表中某一列作为切分键,建议使用主键或有索引的列作为切分键。 |
筛选条件(选填) | 在实际业务场景中,通常会选择当天的数据进行同步,将 where 条件指定为 gmt_create>$bizdate。where 条件可以有效地进行业务增量同步。如果不填写 where 语句,包括不提供 where 的 key 或 value,数据同步均视作同步全量数据。 |
高级设置(选填) | 可根据业务需求配置参数。 |
参数 | 说明 |
数据去向 | 需要写入的 Doris 数据源。 |
库 | 支持选择、或者手动输入需写入的库名称。 默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。 当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
表 | 支持选择、或者手动输入需写入的表名称。 当数据源网络不联通导致无法直接拉取表信息时,可手动输入表名称。在数据集成网络连通的情况下,仍可进行数据同步。 |
表覆盖 | 开启后,doris 将支持表级别的原子覆盖写操作。写入数据前会先使用 CREATE TABLE LIKE 语句创建一个相同结构的新表,将新的数据导入到新表后,通过 swap 方式原子的替换旧表,以达到表覆盖目的。 |
单次提交最大行 | 一次性批量提交的记录数大小。 |
单次提交最大字节 | 一次性批量提交的最大数据量。 |
行分割符(选填) | Doris 写入的键分隔符,默认'\\n',支持手动输入需要您保证与创建的 Doris 表的字段分隔符一致,否则无法在 Doris 表中查到数据。 |
前置 SQL | 执行同步任务之前执行的 SQL 语句,根据数据源类型对应的正确 SQL 语法填写 SQL,例如,执行前清空表中的旧数据(truncate table tablename)。 |
后置 SQL | 执行同步任务之后执行的 SQL 语句,根据数据源类型对应的正确 SQL 语法填写 SQL,例如,加上某一个时间戳 alter table tablename add colname timestamp DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP。 |
高级参数 | 可根据业务需求配置参数。 |
Doris 数据类型 | 内部类型 |
TINYINT、SMALLINT、INT、BIGINT | Long |
FLOAT、DOUBULE、DECIMAL | Double |
VARCHAR、CHAR、ARRAY、STRUCT、STRING | String |
DATE、DATETIME | Date |
BOOLEAN | Boolean |
内部类型 | Doris 数据类型 |
Long | TINYINT、SMALLINT、INT、BIGINT |
Double | DOUBLE、FLOAT、DECIMAL |
String | STRING、VARCHAR、CHAR、ARRAY、STRUCT |
Date | DATETIME、DATE |
Boolean | BOOLEAN |
表 tbl1 分区列 k1 类型为 DATE,创建一个动态分区规则。按天分区,只保留最近7天的分区,并且预先创建未来3天的分区。CREATE TABLE tbl1(k1 DATE,...)PARTITION BY RANGE(k1) ()DISTRIBUTED BY HASH(k1)PROPERTIES("dynamic_partition.enable" = "true","dynamic_partition.time_unit" = "DAY","dynamic_partition.start" = "-7","dynamic_partition.end" = "3","dynamic_partition.prefix" = "p","dynamic_partition.buckets" = "32");假设当前日期为 2020-05-29。则根据以上规则,tbl1 会产生以下分区:p20200529: ["2020-05-29", "2020-05-30")p20200530: ["2020-05-30", "2020-05-31")p20200531: ["2020-05-31", "2020-06-01")p20200601: ["2020-06-01", "2020-06-02")在第二天,即 2020-05-30,会创建新的分区 p20200602: ["2020-06-02", "2020-06-03")在 2020-06-06 时,因为 dynamic_partition.start 设置为 7,则将删除7天前的分区,即删除分区 p20200529。
show tablet 28750963;
SHOW PROC '/dbs/40637/16934967/partitions/28750944/16934968/28750963';
Reason: column_name[uuid], the length of input is too long than schema. first 32 bytes of input str: [0000000000000BB4E595527BE******] schema length: 200; actual length: 232; . src line [];
本页内容是否解决了您的问题?