Bendi新闻
>
管了3年 K8S 集群,我学到了 10 个经验教训!

管了3年 K8S 集群,我学到了 10 个经验教训!

8月前

原文链接:https://zhuanlan.zhihu.com/p/677522936


背景


在过去的三年里,我穿越了管理Kubernetes集群的时而波澜起伏的领域。这段充满挑战和发现的旅程让我深刻理解了这一尖端的技术,以及众多的其他方面。在这篇文章中,我想与您分享我作为Kubernetes集群管理员所学到的十个最有价值的教训。


这些教训涵盖了各种主题,从管理底层基础设施到优化部署流程,包括确保集群可扩展性和安全性的最佳实践。无论您是初次接触Kubernetes的新手还是经验丰富的专家,这些建议都将为您提供如何有效管理Kubernetes集群的丰富视角。


让我们一起深入探讨这些教训,这是三年经验、成功和挑战的结晶。


教训1:使用云里的Kubernetes


除非有极端的约束,否则自己不要去管理Kubernetes底层基础设施。您会花费时间调试那些对您的业务毫无价值的问题。成为kube-api、kube-apiserver、kubelet、etcd、kube-proxy等方面的专家是很棒的,但每天都要自己维护这些并不会创造任何业务价值。您无需成为这些概念的专家就能有效地管理集群。将这个低级任务委托给云服务提供商(AWS、Azure、GCP、OVH等),他们比您做得更好。在HK-TECH,我们选择了AWS和EKS集群(注意ECS不是Kubernetes!)。



教训2:使用代码部署所有与Kubernetes相关的基础设施


集群的任何部分都不应该在控制台上手动完成,甚至连一个简单的标签都不要加。特别是要避免“我先在控制台上快速修复了一下,稍后我就会更新代码”的思维方式。迷思:其实您永远不会这样做。


教训3:避免过度使用您无法完全控制的Helm Charts


是的,它们很棒,工作迅速,您不必为编写您自己的YAML而烦恼,除非有一天更新会导致一切都崩溃。如果您真的很懒或时间很紧,至少努力理解values.yaml文件中的每个变量,并避免使用默认值。在HK-Tech,规则是不使用Helm Chart;在最坏的情况下,我们会仅获取模板。


教训4:Kubernetes不喜欢“lift and shift”。


因此,为了使用到 k8s,你需要从旧应用程序的云迁移适配开始着手。不是让K8s来适应您的应用程序,而是由应用程序适配 k8s。如果您没有重新编写应用程序的能力,也许最好还是坚持使用旧的虚拟机运行的模式。

教训5:Mesh还是不Mesh?


如果不需要,就不要安装服务网格。那么你怎么才知道是否需要它?问自己两个问题:我的集群中的应用程序是否相互通信?我的集群中的应用程序之间的交换是否需要安全策略?如果两者的答案都是肯定的,那么安装服务网格可能是有用的。我没有具体的建议;通常各种 Mash 技术之间都很相似。


教训 6:避免使用过多的工具


Kubernetes提供了大量的辅助工具,承诺为更好地管理您的集群提供山寨和奇迹:argocd、lens、k9s、keda、krew、kubectx、kubens、kail等等。避免将它们像集邮一般的收集起来,老实说:用kubectl就能满足90%的需求。就个人而言,我仅限于使用到了kubectx、kubens和k9s,它们在集群管理上是有收益的。


教训 7 :必须为Pod定义资源限制(内存和CPU)


这将防止糟糕编码或错误配置的应用程序吞噬掉您集群的所有资源,并由于一些贪婪的Pod而导致其他应用程序一个接一个地崩溃。这也是对Helm Chat保持警惕,并始终详细检查封装背后的清单源代码的原因之一。


教训 8:考虑无状态


理想情况下,最好避免在Pod中存储数据。如果由于某种原因无法避免,则最好使用NAS而不是磁盘直接挂载。否则,您可能会惊讶地发现部署中的一些Pod无法访问持久资源。是的,硬盘只能在一个节点上挂载,因此如果您的Pod分布在多个节点上,同一节点上的Pod将看到相同的数据,但其他节点上的Pod将看不到。使用像EFS这样的NAS类型挂载,您就将能避免这个问题。


教训 9:配置HPA(水平Pod自动缩放)


如果您既想停留在旧的工作方式中,又想从Kubernetes的强大之处中受益,那就需要根据需求自动的管理资源利用率,需要在所有应用程序项目上配置HPA。(Helm Chat的另一个限制,很不幸通常非常缺)。


教训 10:不要害怕变革


平均而言,您应该计划每年对集群进行三次版本升级,大约每四个月进行一次更新。某些更新是透明的,但通常会有带来影响的变更。为了更好地准备这些更新,我建议阅读、再阅读和重新阅读版本发布说明,以及那些在您之前进行过版本更新的人的经验。我建议,而且我们在HK-TECH已经实施的是:始终保持在最新版本的上一个版本(除非有安全补丁)。


祝您愉快的Kubernetes之旅!

END

官方站点:www.linuxprobe.com

Linux命令大全:www.linuxcool.com

刘遄老师QQ:5604215

Linux技术交流群:2636170

(新群,火热加群中……)

想要学习Linux系统的读者可以点击"阅读原文"按钮来了解书籍《Linux就该这么学》,同时也非常适合专业的运维人员阅读,成为辅助您工作的高价值工具书!


微信扫码关注该文公众号作者

来源:Linux就该这么学

相关新闻

PPT里只有3段话怎么排版?我精心修改了10个版本,实在是太骚气了!暑假规划强推!等了10年我蕞向往的课程,居然真的实现了她离异带两娃,63岁健身,66岁一口气能拉10个引体!我服了....差点抑郁的那3年,我悟出1个无敌心态!(建议收藏)全球冠军!3个上海中学生站在了世界舞台,5年时间励志成长故事:努力比天赋更重要!死刑!身价90亿80后上市公司创始人被名校海归高管投毒死亡3年后法院判了!打脸~我推荐了3年的童装品牌“摆烂”了!慕了!躺平3年遭遇延毕危机,没想到这名医学生竟靠它0代码光速发文!(0基础可学)澳洲移民爆了!1个月10万+入境,创历史新高!还给数千难民发签证,最久或可居留10年……BC省暖爆了!1天10个社区破纪录,加拿大119年记录也被打破暴富机会!2024年澳洲最值得买房的地区!这10个被曝光了!但新州州长承认,“画的大饼”无法实现了...“在英国私校读了6年,A-Level阶段铁了心要转学!我也有自己的理由……”用了10年身体乳涂了个寂寞?原来你一直都选错了!“分文未付,造成很大损失”!上市公司把一地城管局告了,涉及近3年垃圾处理服务费上千万元!小学娃如何学数理化?让我给你提10个建议!澳洲学签改革立竿见影!3月入境留学生创10年新低,离境人数创5年新高唏嘘!TVB“御用老外”烧炭轻生,放弃学医来港37年,3个月前刚经历一场变故...6年后英伟达会涨到10万亿!这位投资人有3个理由!多次访美探亲看孙,海关恐吓:3个月必须离境,否则撤销10年旅游签证!“我看不到未来了”!华人女留学生到加拿大10年都未站稳脚跟,最终选择回流!这些方面让她倍感失望...服…设计鬼才,3个面的牙刷!360°包裹,逼出10年老牙渍快消外企春招丨ALDI奥乐齐管培生计划启动!0-2年工作经验可投,德国外企,六险一金,带薪年假10天起100元3个?!全网都在刷屏的“便宜榴莲”,我买了!全是套路!闹大了!2000+个签证被澳洲政府发放,大批难民入澳,或10年不被驱逐
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。