Cluster Autoscaler 与基于监控指标的弹性伸缩的节点扩缩容有什么不同?
Cluster Autoscaler 确保集群中的所有 Pod 都可调度,不管具体的负载;而基于监控指标的节点弹性伸缩在自动扩缩时不关心 Pod,可能会添加一个没有任何 Pod 的节点,或者删除一个有一些系统关键 Pod 的节点,例如 kube-dns。Kubernetes 不鼓励这种自动缩容机制,故 Cluster Autoscaler 与基于监控指标的弹性伸缩的节点互相冲突,请不要同时启用。
CA 和伸缩组的对应关系是什么?
启用 CA 的集群会根据选择的节点配置,创建一个启动配置和绑定此启动配置的伸缩组。绑定后,将会在此伸缩组内进行扩缩容,扩容后的 CVM 自动加入集群。自动扩缩容的节点都是按量计费的。伸缩组的相关文档请参见 弹性伸缩文档。 容器服务控制台手动添加的节点是否会 CA 缩容?
不会,CA 缩容的节点只限于伸缩组内的节点。在 容器服务控制台 添加的节点不会加入到伸缩组中。 弹性伸缩控制台是否可以添加或者移出云服务器?
扩缩容会继承所选节点的哪些配置?
创建伸缩组时,需要选择集群内的一个节点作为参考来创建 启动配置,参考的节点配置包括: vCPU
内存
系统盘大小
数据盘大小
磁盘类型
带宽
带宽计费模式
是否分配公网IP
安全组
私有网络
子网
如何使用多个伸缩组?
根据服务的重要级别、类型等特点,您可以通过创建多个伸缩组,为伸缩组设置不同的 label,从而指定伸缩组扩容出节点的 label,来对服务进行分类。
扩缩容最大值可以设置为多少?
目前腾讯云用户每个可用区均有30个按量计费类型 CVM 配额,如果希望伸缩组有超过 30 台按量计费的 CVM,请提交工单申请。
具体配额请参见您当前可用区的云服务器 实例数及配额。另外弹性伸缩也有最大值的限制,其最大值为200。如果希望弹性伸缩超过最大值,请提交工单申请。 集群启用缩容是否安全?
由于在缩容节点时会发生 Pod 重新调度的情况,所以服务必须可以容忍重新调度和短时的中断时再启用缩容。建议您为您的服务设置 PDB。PDB 可以在任何时候指定一个处于运行状态的 Pod 集合副本的最小数量或者最小百分比。有了 PodDisruptionBudget,应用部署者可以保证同一时间内主动移除 Pod 的集群操作不会销毁过多 Pod,避免了因销毁过多 Pod 导致数据丢失、服务中断或者无法接受的服务降级等影响。 节点上有哪些类型的 Pod 时不会被缩容?
当您设置了严格的 PodDisruptionBudget 的 Pod 不满足 PDB 时,不会缩容。
Kube-system 下的 Pod。
节点上有非 deployment,replica set,job,stateful set 等控制器创建的 Pod。
Pod 有本地存储。
Pod 不能被调度到其他节点上。
节点满足缩容条件后多长时间会触发缩容?
10分钟。
节点 Not Ready 后多长时间会触发缩容?
20分钟。
多长时间扫描一次是否需要扩缩容?
10秒。
需要多长时间才可以扩容出 CVM?
一般在10分钟内,相关弹性伸缩的说明文档请参见 弹性伸缩。 为什么有 Unschedulable 的 Pod,却未进行扩容?
请确认以下原因:
Pod 的请求资源是否过大。
是否设置了 node selector。
伸缩组的最大值是否已经达到。
账号余额是否充足(账号余额不足,弹性伸缩无法扩容),以及配额不足等其他原因,请参见 弹性伸缩故障处理。 如何防止 Cluster Autoscaler 缩容特定节点?
# 可以在节点的annotations中设置如下信息
kubectl annotate node <nodename> cluster-autoscaler.kubernetes.io/scale-down-disabled=true
扩缩容事件如何反馈给用户?
用户可在弹性伸缩控制台查询伸缩组的伸缩活动,也可查看 k8s 的事件。在以下三种资源上都会有对应的事件:
kube-system/cluster-autoscaler-status config map
ScaledUpGroup - CA 触发扩容。
ScaleDownEmpty - CA 删除了一个没有运行 Pod 的节点。
ScaleDown - CA 缩容。
node
ScaleDown - CA 缩容。
ScaleDownFailed - CA 缩容失败。
pod
TriggeredScaleUp - CA 由于此 Pod 触发扩容。
NotTriggerScaleUp - CA 无法找到可扩容的伸缩组使得此 Pod 可调度。
ScaleDown - CA 尝试驱逐此 Pod 来缩容节点。
本页内容是否解决了您的问题?