看啥推荐读物
专栏名称: 中生代技术
程序员突破成长的伙伴,7点送上营养早餐;链接3000+CTO,助力企业技术提升!
今天看啥  ›  专栏  ›  中生代技术

2年云原生落地实践在运维和开发侧踩过的6个坑

中生代技术  · 公众号  ·  · 2022-12-21 08:48
应阔浩 李建宇 等读完需要11分钟速读仅需 4 分钟摘要:云原生落地之路并不是一帆风顺的,无论是在运维侧还是研发侧,我们都走过不少冤枉路,下面把曾经遇到的“坑”汇总到一起,分享给在云原生之路探索的你。1   运维侧的教训运维侧最核心的目标就是保障 Kubernetes 集群的稳定性,在搭建 Kubernetes 集群的过程中,我们遇到了 2 个比较严重的问题,一个是容器产生僵尸进程,另一个是内核 Bug 引起的 Kubelet 负载飙升。1.1   容器产生僵尸进程Web 终端僵尸进程是困扰我们很久的问题,表现为当研发人员重启 Pod 时,发现集群中存在偶发的一些状态为 Not Ready 的节点,非常诡异,百思不得其解。后来发现原来是过多的 Bash 进程触发了 containerd-shim 的一个 Bug 所致。让我们一起来剖析问题的前因后果。问题描述在集群正常运行过程中,运维人员隔一段 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照