- Cluster Maintenance 集群维护 11%
- 理解k8s的集群升级过程
- 促进操作系统的升级
- 补充备份和还原的方法论
k8s版本升级: 对于GCE , 升级集群需要删除并重建master, 对于node也是如此 对应GKE, 集群的master和系统的add-on会自动更新
k8s节点维护: 当你重启机器时,kubelet会在机器重启后把原先分配在上面的pod也启动。 但是如果机器重启需要的时间较长,超过了--pod-eviction-timeout指定的时间(默认是5分钟),这时候node controller会把终结这个node上的pod,并进行重新调度。 相比重启, 更加优雅的做法是: kubectl cordon <node_name> 对机器置维护, kubectl drain <node_name> 优雅的终结并驱逐pod kubectl uncordon <node_name> 解除维护状态
参考 官方文档之集群管理