tencent cloud

文档反馈

导入的严格模式

最后更新时间:2024-06-27 11:06:07
    严格模式(strict_mode)为导入操作中的一个参数配置。该参数会影响某些数值的导入行为和最终导入的数据。 本文档主要说明如何设置严格模式,以及严格模式产生的影响。

    如何设置

    严格模式默认情况下都为 False,即关闭状态。 不同的导入方式设置严格模式的方式不尽相同。
    LOAD LABEL example_db.label1
    (
    DATA INFILE("bos://my_bucket/input/file.txt")
    INTO TABLE `my_table`
    COLUMNS TERMINATED BY ","
    )
    WITH BROKER bos
    (
    "bos_endpoint" = "http://bj.bcebos.com",
    "bos_accesskey" = "xxxxxxxxxxxxxxxxxxxxxxxxxx",
    "bos_secret_accesskey"="yyyyyyyyyyyyyyyyyyyyyyyyyy"
    )
    PROPERTIES
    (
    "strict_mode" = "true"
    )
    curl --location-trusted -u user:passwd \\
    -H "strict_mode: true" \\
    -T 1.txt \\
    http://host:port/api/example_db/my_table/_stream_load
    CREATE ROUTINE LOAD example_db.test_job ON my_table
    PROPERTIES
    (
    "strict_mode" = "true"
    )
    FROM KAFKA
    (
    "kafka_broker_list" = "broker1:9092,broker2:9092,broker3:9092",
    "kafka_topic" = "my_topic"
    );
    4. INSERT INTO 通过 变量(variables) 设置:
    SET enable_insert_strict = true;
    INSERT INTO my_table ...;

    严格模式的作用

    严格模式的意思是,对于导入过程中的列类型转换进行严格过滤。严格过滤的策略如下:
    对于列类型转换来说,如果开启严格模式,则错误的数据将被过滤。这里的错误数据是指:原始数据并不为 null,而在进行列类型转换后结果为 null 的这一类数据。
    这里所指的 列类型转换,并不包括用函数计算得出的 null 值。
    对于导入的某列类型包含范围限制的,如果原始数据能正常通过类型转换,但无法通过范围限制的,严格模式对其也不产生影响。例如:如果类型是 decimal(1,0) , 原始数据为 10,则属于可以通过类型转换但不在列声明的范围内。这种数据 strict 对其不产生影响。
    以列类型为 TinyInt 来举例
    原始数据类型
    原始数据举例
    转换为 TinyInt 后的值
    严格模式
    结果
    空值
    \\N
    NULL
    开启或关闭
    NULL
    非空值
    "abc" or 2000
    NULL
    开启
    非法值(被过滤)
    非空值
    "abc"
    NULL
    关闭
    NULL
    非空值
    1
    1
    开启或关闭
    正确导入
    说明
    表中的列允许导入空值。
    abc2000 在转换为 TinyInt 后,会因类型或精度问题变为 NULL。在严格模式开启的情况下,这类数据将会被过滤。而如果是关闭状态,则会导入 null
    以列类型为 Decimal(1,0) 举例
    原始数据类型
    原始数据举例
    转换为 Decimal 后的值
    严格模式
    结果
    空值
    \\N
    null
    开启或关闭
    NULL
    非空值
    aaa
    NULL
    开启
    非法值(被过滤)
    非空值
    aaa
    NULL
    关闭
    NULL
    非空值
    1 or 10
    1 or 10
    开启或关闭
    正确导入
    说明
    表中的列允许导入空值。
    abc 在转换为 Decimal 后,会因类型问题变为 NULL。在严格模式开启的情况下,这类数据将会被过滤。而如果是关闭状态,则会导入 null
    10 虽然是一个超过范围的值,但是因为其类型符合 decimal 的要求,所以严格模式对其不产生影响。10 最后会在其他导入处理流程中被过滤。但不会被严格模式过滤。
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持