【云原生】K8s pod 动态弹性扩缩容 HPA

作者：liugp 2023-02-08 07:55:33云计算云原生对于自定义指标，将使用 custom.metrics.k8s.io API。它由其他度量指标方案厂商的“适配器（Adapter）” API 服务器提供。检查你的指标管道以查看是否有可用的 Kubernetes 指标适配器。

一、概述

Horizontal Pod Autoscaler（HPA，Pod水平自动伸缩），根据平均 CPU 利用率、平均内存利用率或你指定的任何其他自定义指标自动调整Deployment、ReplicaSet或StatefulSet或其他类似资源，实现部署的自动扩展和缩减，让部署的规模接近于实际服务的负载。HPA不适用于无法缩放的对象，例如DaemonSet。

官方文档：https://kubernetes.io/zh-cn/docs/tasks/run-application/horizontal-pod-autoscale/

实际生产中，一般使用这四类指标：

Resource metrics——CPU核和内存利用率指标。Pod metrics——例如网络利用率和流量。Object metrics——特定对象的指标，比如Ingress, 可以按每秒使用请求数来扩展容器。Custom metrics——自定义监控，比如通过定义服务响应时间，当响应时间达到一定指标时自动扩容。

二、安装 metrics-server

1）HPA 前提条件

默认情况下，Horizontal Pod Autoscaler 控制器会从一系列的 API 中检索度量值。集群管理员需要确保下述条件，以保证 HPA 控制器能够访问这些 API：

对于资源指标，将使用 metrics.k8s.io API，一般由metrics-server提供。它可以作为集群插件启动。对于自定义指标，将使用 custom.metrics.k8s.io API。它由其他度量指标方案厂商的“适配器（Adapter）” API 服务器提供。检查你的指标管道以查看是否有可用的 Kubernetes 指标适配器。对于外部指标，将使用 external.metrics.k8s.io API。可能由上面的自定义指标适配器提供。

Kubernetes Metrics Server：

Kubernetes Metrics Server 是 Cluster 的核心监控数据的聚合器，kubeadm 默认是不部署的。Metrics Server 供 Dashboard 等其他组件使用，是一个扩展的 APIServer，依赖于 API Aggregator。所以，在安装 Metrics Server 之前需要先在 kube-apiserver 中开启 API Aggregator。Metrics API 只可以查询当前的度量数据，并不保存历史数据。Metrics API URI 为 /apis/metrics.k8s.io/，在 k8s.io/metrics 下维护。必须部署 metrics-server 才能使用该 API，metrics-server 通过调用 kubelet Summary API 获取数据。

2）开启 API Aggregator

# 添加这行# --enable-aggregator-routing=true### 修改每个 API Server 的 kube-apiserver.yaml 配置开启 Aggregator Routing：修改 manifests 配置后 API Server 会自动重启生效。cat /etc/kubernetes/manifests/kube-apiserver.yaml

3）开始安装 metrics-server

GitHub地址：https://github.com/kubernetes-sigs/metrics-server/releases下载

wget https://github.com/kubernetes-sigs/metrics-server/releases/download/metrics-server-helm-chart-3.8.2/components.yaml

修改

...  template:    metadata:      labels:        k8s-app: metrics-server    spec:      containers:- args:---cert-dir=/tmp---secure-port=4443---kubelet-preferred-address-types=InternalIP,ExternalIP,Hostname---kubelet-use-node-status-port---kubelet-insecure-tls                    #   加上该启动参数，不加可能会报错        image: registry.aliyuncs.com/google_containers/metrics-server:v0.6.1   # 镜像地址根据情况修改        imagePullPolicy: IfNotPresent...

metrics-server pod无法启动，出现日志unable to fully collect metrics: … x509: cannot validate certificate for because … it doesn’t contain any IP SANs …解决方法：在metrics-server中添加–kubelet-insecure-tls参数跳过证书校验

开始安装

kubectl apply -f components.yamlkubectl get pod -n kube-system | grep metrics-server# 查看kubectl get pod -n kube-system | grep metrics-server# 查看node和pod资源使用情况kubectl top nodeskubectl top pods

三、Horizontal Pod Autoscaler 工作原理

1）原理架构图

自动检测周期由 kube-controller-manager 的–horizontal-pod-autoscaler-sync-period参数设置（默认间隔为15 秒）。metrics-server 提供 metrics.k8s.io API 为pod资源的使用提供支持。15s/周期 -> 查询metrics.k8s.io API -> 算法计算 -> 调用scale 调度 -> 特定的扩缩容策略执行。

2）HPA扩缩容算法

从最基本的角度来看，Pod 水平自动扩缩控制器根据当前指标和期望指标来计算扩缩比例。

期望副本数 = ceil[当前副本数 *(当前指标 / 期望指标)]

1、扩容

如果计算出的扩缩比例接近 1.0, 将会放弃本次扩缩, 度量指标 / 期望指标接近1.0。

2、缩容

冷却/延迟: 如果延迟（冷却）时间设置的太短，那么副本数量有可能跟以前一样出现抖动。默认值是 5 分钟（5m0s）–horizontal-pod-autoscaler-downscale-stabilization

3、特殊处理

丢失度量值：缩小时假设这些 Pod 消耗了目标值的 100%，在需要放大时假设这些 Pod 消耗了 0% 目标值。这可以在一定程度上抑制扩缩的幅度。存在未就绪的pod的时候：我们保守地假设尚未就绪的 Pod 消耗了期望指标的 0%，从而进一步降低了扩缩的幅度。未就绪的 Pod 和缺少指标的 Pod 考虑进来再次计算使用率。如果新的比率与扩缩方向相反，或者在容忍范围内，则跳过扩缩。否则，我们使用新的扩缩比例。指定了多个指标，那么会按照每个指标分别计算扩缩副本数，取最大值进行扩缩。

3）HPA 对象定义

apiVersion: autoscaling/v2beta2kind: HorizontalPodAutoscalermetadata:  name: nginxspec:  behavior:  scaleDown:    policies:- type: Pods      value:4      periodSeconds:60- type: Percent      value:10      periodSeconds:60    stabilizationWindowSeconds:300  scaleTargetRef:    apiVersion: apps/v1    kind: Deployment    name: nginx  minReplicas:1  maxReplicas:10  metrics:- type: Resource    resource:      name: cpu      target:        type: Utilization        averageUtilization:50

HPA对象默认行为

behavior:  scaleDown:    stabilizationWindowSeconds:300    policies:- type: Percent      value:100      periodSeconds:15  scaleUp:    stabilizationWindowSeconds:0    policies:- type: Percent      value:100      periodSeconds:15- type: Pods      value:4      periodSeconds:15    selectPolicy: Max

四、示例演示

1）编排yaml

apiVersion: autoscaling/v2kind: HorizontalPodAutoscalermetadata:  name: hpa-nginxspec:  maxReplicas:10 # 最大扩容到10个节点（pod）  minReplicas:1 # 最小扩容1个节点（pod）  metrics:- resource:      name: cpu      target:        averageUtilization:40 # CPU 平局资源使用率达到40%就开始扩容，低于40%就是缩容        # 设置内存        # AverageValue：40        type: Utilization    type: Resource  scaleTargetRef:    apiVersion: apps/v1    kind: Deployment    name: hpa-nginx---apiVersion: v1kind: Servicemetadata:  name: hpa-nginxspec:  type: NodePort  ports:- name:"http"      port:80      targetPort:80      nodePort:30080  selector:    service: hpa-nginx---apiVersion: apps/v1kind: Deploymentmetadata:  name: hpa-nginxspec:  replicas:1  selector:    matchLabels:      service: hpa-nginx  template:    metadata:      labels:        service: hpa-nginx    spec:      containers:- name: hpa-nginx          image: nginx:latest          resources:            requests:              cpu:100m              memory:100Mi            limits:              cpu:200m              memory:200Mi

主要参数解释如下：

scaleTargetRef：目标作用对象，可以是Deployment、ReplicationController或ReplicaSet。minReplicas和maxReplicas：Pod副本数量的最小值和最大值，系统将在这个范围内进行自动扩缩容操作，并维持每个Pod的内存使用率为40%，这个值就是上面设置的阈值averageUtilization。metrics：目标指标值。在metrics中通过参数type定义指标的类型；通过参数target定义相应的指标目标值，系统将在指标数据达到目标值时（考虑容忍度的区间，见前面算法部分的说明）触发扩缩容操作。对于CPU使用率，在target参数中设置averageUtilization定义目标平均CPU使用率。对于内存资源，在target参数中设置AverageValue定义目标平均内存使用值。

执行

kubectl apply -f test.yaml

2）使用 ab 工具进行压测

进入apache官网http://httpd.apache.org/下载apache即可，或者直接通过yum安装apache都行，这里选择最简单的方式yum安装

yum install httpd -y

开始压测

ab -n 100000-c 800 http://local-168-182-112:30080/#-c：并发数#-n：总请求数