tencent cloud

文档反馈

命名规范及库表限制

最后更新时间:2024-07-31 09:17:18
    本文将为您介绍腾讯云数据仓库 TCHouse-D 的命名规范,及一些库表创建/变更的限制。

    命名规范

    数据库

    名称:表名以字母或下划线开头,可包含字母、数字以及下划线,长度为1到64个字符。
    描述:最多不超过2048个字符。
    限制:同一个数据链接下,不允许有相同的数据库名称。

    数据表/视图

    名称:表名以字母或下划线开头,可包含字母、数字以及下划线,长度为1到64个字符。
    描述:最多不超过2048个字符。
    限制:同一个数据库下,不允许有相同的数据表名称。

    属性列

    名称:列名以字母或下划线开头,可包含字母、数字以及下划线,长度为1到256个字符。
    描述:最多不超过256个字符。
    限制:同一个数据表下,不允许有相同的数据列名称。

    分区

    分区字段名称:长度为1到256个字符。
    使用建议:
    1. 单表数据量在2亿条以下时,为了方便,可选择不设置分区,而是直接使用分桶;
    2. 分区字段具有连续的数据范围(如日期、ID)时,建议选择 Range 分区;
    3. 数据具有离散的取值(如国家、地区、状态等)时,建议选择 LIST 分区。

    分桶

    分桶字段名称:长度为1到256个字符
    使用建议:
    1. 分桶 key 可以一个或者多个,多个保证数据分布更均衡,单个容易匹配命中。
    2. 分桶列的选择:一般选择区分度/基数较高、hash均匀的字段,避免数据倾斜;且应该是经常使用的字段,提高查询效率;
    3. 创建的分桶数不宜过多或者过少,建议每个分桶最好保持在 1-10G 之间。

    使用限制

    库/表/列/分区的数量限制

    限制项
    数量限制
    可创建 catalog 数量
    20
    每个集群的数据库数量
    10,000
    每个用户的数据库数量
    1,000
    每个集群的数据表数量
    100,000
    每个用户的数据表数量
    10,000
    每个数据库的数据表数量
    4,096
    每个表的字段数量
    2,048
    每个表的分区数
    10,000
    每个集群的视图数
    10,000
    视图最大嵌套层级
    10
    每个集群的物化视图数
    10,000

    查询限制

    限制项
    限制说明
    补充
    每天的查询数据量
    无限制
    -
    单个 SQL 查询的表数量
    32
    -
    单个 SQL 查询超时时间
    900秒
    -
    每个外部表的最大文件数
    不限制
    -

    DML/DML 限制

    限制项
    限制说明
    补充
    每个集群同时在进行的 Schema 变更
    20
    -
    每个表同时在进行的 Schema 变更
    1
    -
    每个表的数据写入并发(每秒)
    10
    不建议高频写入,建议适量攒批:每个表一分钟总导入次数不得超过20次
    每个表的同一个 key 的数据写入并发(每秒)
    1
    同一张表不能同时更新同一个 key,否则可能导致数据不准确
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持