本文将为您介绍腾讯云数据仓库 TCHouse-D 的命名规范,及一些库表创建/变更的限制。
命名规范
数据库
名称:表名以字母或下划线开头,可包含字母、数字以及下划线,长度为1到64个字符。
描述:最多不超过2048个字符。
限制:同一个数据链接下,不允许有相同的数据库名称。
数据表/视图
名称:表名以字母或下划线开头,可包含字母、数字以及下划线,长度为1到64个字符。
描述:最多不超过2048个字符。
限制:同一个数据库下,不允许有相同的数据表名称。
属性列
名称:列名以字母或下划线开头,可包含字母、数字以及下划线,长度为1到256个字符。
描述:最多不超过256个字符。
限制:同一个数据表下,不允许有相同的数据列名称。
分区
分区字段名称:长度为1到256个字符。
使用建议:
1. 单表数据量在2亿条以下时,为了方便,可选择不设置分区,而是直接使用分桶;
2. 分区字段具有连续的数据范围(如日期、ID)时,建议选择 Range 分区;
3. 数据具有离散的取值(如国家、地区、状态等)时,建议选择 LIST 分区。
分桶
分桶字段名称:长度为1到256个字符
使用建议:
1. 分桶 key 可以一个或者多个,多个保证数据分布更均衡,单个容易匹配命中。
2. 分桶列的选择:一般选择区分度/基数较高、hash均匀的字段,避免数据倾斜;且应该是经常使用的字段,提高查询效率;
3. 创建的分桶数不宜过多或者过少,建议每个分桶最好保持在 1-10G 之间。
使用限制
库/表/列/分区的数量限制
|
可创建 catalog 数量 | 20 |
每个集群的数据库数量 | 10,000 |
每个用户的数据库数量 | 1,000 |
每个集群的数据表数量 | 100,000 |
每个用户的数据表数量 | 10,000 |
每个数据库的数据表数量 | 4,096 |
每个表的字段数量 | 2,048 |
每个表的分区数 | 10,000 |
每个集群的视图数 | 10,000 |
视图最大嵌套层级 | 10 |
每个集群的物化视图数 | 10,000 |
查询限制
|
每天的查询数据量 | 无限制 | - |
单个 SQL 查询的表数量 | 32 | - |
单个 SQL 查询超时时间 | 900秒 | - |
每个外部表的最大文件数 | 不限制 | - |
DML/DML 限制
|
每个集群同时在进行的 Schema 变更 | 20 | - |
每个表同时在进行的 Schema 变更 | 1 | - |
每个表的数据写入并发(每秒) | 10 | 不建议高频写入,建议适量攒批:每个表一分钟总导入次数不得超过20次 |
每个表的同一个 key 的数据写入并发(每秒) | 1 | 同一张表不能同时更新同一个 key,否则可能导致数据不准确 |
本页内容是否解决了您的问题?