机型类型 | 计算节点规格 | 建议存储类型 | 建议场景 |
标准型 | 4核16G | 高性能云硬盘 SSD 云硬盘 增强型 SSD 云硬盘 | 仅限于 POC 功能测试或个人学习使用,主要用于体验测试产品能力。 |
| 8核32G | 高性能云硬盘 SSD 云硬盘 增强型 SSD 云硬盘 | 推荐用于测试环境,可支持中等数据规模、较复杂的数据分析 |
| 16核64G | 高性能云硬盘 SSD云硬盘 增强型 SSD 云硬盘 | 推荐用于生产环境,可支持较大规模、较复杂场景的数据分析,及高并发场景 |
| 32核及以上 | 高性能云硬盘 SSD 云硬盘 增强型 SSD 云硬盘 | 生产环境推荐配置,可支持大量高复杂度数据分析,高并发等场景 |
场景 | 高可用选择 | 建议最小 FE 节点数 | 建议最小 BE 节点数 |
POC 功能测试 | 非高可用 | 1个 | 3个 |
生产场景(查询高可用) | 读高可用 | 最少3个FE节点 | 最少3个 BE 节点,按需扩缩容 |
生产场景(查询/写入高可以用) | 读写高可用 | 最少5个FE节点 | 最少3个 BE 节点,按需扩缩容 |
跨AZ高可用场景 | 读写高可用+3AZ部署 | 最少5个FE节点 | 最少3个 BE 节点,以3为阶梯扩缩容 |
常见场景 | 资源耗用表现 | 使用率持续超过85%时调优建议 |
过多数据持续导入 | FE 和 BE 的 CPU、内存都会被大量占用 | 如果是 FE 瓶颈:建议纵向升配 如果是 BE 瓶颈:建议纵向升配 |
点查较多/高并发 | FE 和 BE 的 CPU 都会被大量占用 | 如果是 FE 瓶颈:建议纵向升配 如果是 BE 瓶颈:建议纵向升配 |
元数据频繁变更删除 | FE 内存大量占用 | 建议 FE 纵向升配,增加内存 |
多表关联/聚合查询较多 | BE 的 CPU、内存会大量占用 | 优先建议 BE 横向扩容,也可纵向升配 |
数据多并发度写入 | BE 的 CPU、内存会大量占用 | 优先建议 BE 横向扩容,也可纵向升配 |
操作类型 | 注意事项 |
水平扩容 | 水平扩容过程中,系统读写仍可进行,但是可能出现一些抖动,执行操作大约需要5 - 15分钟,请选择在非业务高峰期进行。 在数据存储量及查询量均相对增长时,优先选择水平扩容。 |
水平缩容 | 只能每次选择一类节点进行缩容操作,如仅缩容 FE 或 仅缩容 BE。 FE 缩容:可一次性缩容多个。 BE 缩容:一次性缩容多个 BE 节点有可能导致数据丢失或时间过长,建议逐个缩容。 缩容过程中,系统读写仍可进行,但是可能出现一些抖动。 |
垂直升配/降配 | 垂直变配系统不可读、不可写。 计算规格支持升配、降配;存储规格仅支持升配。 变配操作结果对集群所有节点均生效。 |
调优类型 | 调优说明 |
使用建议 | 如果经常对某列进行点查,且列的基数较高,建议在此列创建 bloom filter 索引。 如果经常对某表进行模式固定的聚合查询,建议在此表创建物化视图。 建议结合业务场景合理分区分桶,避免分区分桶过多占用FE内存。 普通数据探查的 sql,如果不需要全部数据,建议加上limit返回条数限制,也可加速查询。 导入数据建议用 CSV,避免 Json 数据格式。 |
尽量避免 | 避免 select * 查询; 避免全局开profile(会带来较多资源开销,建议针对需要的 SQL 开 profile) 建表时:避免开启 merge_on_write(此功能暂不成熟) 建表时:避免开启 auto bucket(此功能暂不成熟) 建表时:避免开启动态 Schema 表(此功能暂不成熟) 避免多个大表 Join,涉及多个大表关联时: 可转为大表两两 join,并使用 Colocation Join。 或使用预聚合表、索引等进行查询加速。 |
参数调优 | 一条 SQL 涉多并发时,建议调大 parallel_fragment_exec_instance_num 参数,此参数默认值200,可按倍数调大(如400、800),建议控制在2000以内。建议控制 compaction 速度,若监控指标 base_compaction_score 超过200且持续上升的话(具体可在“集群监控-BE指标-BE”页查看),可以将 compaction_task_num_per_disk 参数配置调大(系统默认2,可调大至4或更多)。 |
本页内容是否解决了您的问题?