[reinvent 2024] AWS 기반 Kubernetes의 미래
Summary
Kubernetes는 응용 프로그램 포트폴리오를 현대화하려는 조직의 표준 방법이 되었습니다.
AWS는 Amazon EKS를 개발하여 모든 규모의 조직에 Kubernetes가 보다 액세스 할 수 있도록 하여 비즈니스에 가장 중요한 것에 집중 할 수 있도록 도와줍니다. 이 세션에서는 Amazon EKS 제품 리더십에 가입하여 Kubernetes 플랫폼 및 응용 프로그램을 더 빨리 구축하기 위한 최신 혁신 및 전략에 대해 알아볼 수 있습니다.
리인벤트 2024 테크 블로그의 더 많은 글이 보고 싶다면?
Overview
들어가며
re:Invent 2024 세션 중에서 제일 고대하고 기다리던 세션입니다. 이 세션을 통해서 현재의 모습과 신기능을 확인할 수 있으며, 앞으로 가야 하는 방향성에 대해서 소개를 하고 있습니다. 이 세션에서 소개하는 기능과 새로 알게된 내용을 위주로 정리를 해보고자 합니다.
7년된 EKS 서비스
이번에 발표된 신기술에는 Auto Mode와 Hybrid Nodes 가 메인으로 보입니다.
그 이외에, Amazon Linux 2023, 자동 버전 업그레이드, 완전한 IPv6 지원, Metrics Dashboard, Node 헬스 체크 및 자동 복구등 사소한 기능등도 설명하며, 좀더 운영을 편리하고 안정적으로 서비스 할 수 있는 기능들이 추가되었습니다.
향상된 ECR Image 스캐닝 기능
이전에 claire라는 이미지 스캔 라이브러리가 있었지만 고객이 요구하는 라이브러리와 모든 취약성 데이터베이스가 없었다고 합니다.
그래서 Amazon Inspector와 통합하여, ECR 기본 및 향상된 이미지 스캔을 도입하였고, 50개가 넘는 취약성 데이터베이스와 12개 이상의 운영체제를 제공하게 되었다고 합니다.
ECR pull through cache
이전에는 Public Image Registry (예:docker hub) 에서 이미지를 받아서 ECR에 올려줘야 하는 불편함이 있었는데, pull through cache 기능으로 동기화를 설정하면, 주기적으로 Public Image Registry에서 자동으로 ECR에 가져오고 이미지 스캔을 한다고 합니다.
그래서 보안도 향상하고, 이미지를 올리는 번거로움을 해소 할 수 있게 되어 기대하고 있는 기능입니다.
Kubernetes 업스트림 릴리스 사이클 개선
쿠버네티스를 처음 접한 2022년 도만 하더라도, Kubernetes 에 새로운 버전이 올라오면 6개월 정도 지나서, EKS 버전이 올라왔었습니다. 그런데 현재는 40일 정도가 소요가 되고, 재작년에 비해서 매우 빠른 시간내에 신 버전을 사용할 수 있게 되었습니다.
항상 새로운 버전이 안정성이 있는지, 빨리 적용하는게 맞는지 고민을 하게 되는데, AWS에서도 안정성을 고려하여 더 이상 시간 단축을 하지 않는다고 하여, 믿고 EKS 업그레이드를 해도 되겠다는 생각을 하였습니다.
Amazon EKS 확장 서포트 지원
기존 14개월의 EKS 버전의 유지보수가 가능하여서, 항상 이 기간 내에 EKS를 업그레이드 해야 하는 부담이 있었습니다. (EKS를 사용하면 어쩔 수 없는 숙명)
EKS 버전을 업그레이드 할 수 없는 상황이라면 2배 더 늘어난 extended support도 고려 대상으로 가져갈 수 있을 것 같습니다.
CloudWatch Container Insights with Enhanced Observability
EKS 관제를 위해서 CloudWatch Container Insighs 를 설치하곤 하는데, 이번에 기능 향상이 되었다고 하니 좀더 확인이 필요로 할 것 같다.
CloudWatch Network Flow Monitor
서비스를 하다 보면 네트워크 문제는 항상 겪을 수 밖에 없는 문제인데, CloudWatch Network Flow Monitor 기능으로 가시성을 제공하여, 적용을 하면 굉장히 좋아 보이는 신규 기능입니다. 꼭 빠른 시일에 확인을 해봐야 하는 기능으로 보입니다.
배포단위의 비용 측정
항상 NodeGroup 기반으로 비용을 환산할 수 밖에 없었는데, 이제는 Pod간, Namespace 간으로도 비용을 산정할 수 있는 기능입니다. 운영을 하다 보면 꼭 필요로 하는 기능이 이번에 출시되어 기대가 됩니다.
EKS Addon에 Pod Identity 적용 가능
예전에 Addon은 Pod Identity를 적용할 수 없어, IRSA를 적용해서 썼었고, Kubernetes API와 AWS API 양쪽에 적용해 줘야하는 불편함을 가질 수 있었습니다. 이제는 AWS API만으로 일관되게 적용할 수 있게 되어 이 기능도 기대하고 있습니다.
Cedar Access Controls for Kubernetes (alpha)
기존에 Kubernetes 액세스 제어에 별도 솔루션이 없는 상황이 이어서, 이 기능또한 기대를 하는 기능입니다.
IPv6 지원
EKS를 사용하다며보면 IP 부족현상을 겪게 되는데, 이 부분을 해소할 수 있을 지 확인이 필요로 한 기능입니다.
Application Recovery Controller (ARC)
AZ 장애시에 자동 전환 될 수 있다고 하는데, 좀더 자세한 확인이 필요로 합니다.
Kube Resource Orchestrator (KRO)
리소스 관리를 YAML 기반으로 작성이 가능하여, GitOps화 할 수 있는 솔루션으로 보입니다.
여러 대체재가 존재하여 얼마만큼의 인기를 끌 수 있을 지 모르겠지만 확인이 필요로한 기능으로 보입니다.
Amazon EKS Hybrid Nodes
항상 Onprem이 아닌 Workloads를 AWS에 올려야 하는 단점을 보완할 수 있는 좋은 기능으로 보입니다. 좀더 AWS EKS를 폭넣게 쓸 수 있는 좋은 기능이라고 생각합니다.
EKS Cluster Auto Mode
위의 사진에서도 볼 수 있듯이 EC2 마저도 AWS 에서 관리를 하여 운영 유지보수를 대폭 줄여줄 수 있는 제일 기대하는 기능입니다. EKS Fargate는 Bootstrap 속도가 너무 느렸고, Nodegroup에 Karpenter를 적용하기에 설치의 번거러움이 존재하였습니다.
이제는 이 기능으로 필요한 리소스만 사용을 하여 비용 절감 효과를 기대할 수 있을 것 같습니다.
Amazon EKS Node Health 와 자동 복구
서비스 안정성을 증가하기 위해서는 Health check 및 자동 복구기능은 필수입니다.
이 기능 또한 기대를 하고 있습니다.
The future of Amazon EKS
이번에 출시된 기능들을 보면 하이브리드 통합/관리의 편리성을 위한 새로운 기능들 출시된 것으로 보입니다.
앞으로 Platform Components와 개발자 경험 통합에 대한 가이드를 가지고 있으므로 내년, 내후년에도 앞으로 나올 새로운 기능들에 대해서 기대가 됩니다.
앞으로의 3년간 투자 우선순위입니다.
- 모든 규모의 중요한 워크로드 패턴에 최적화된 경험 제공
- 관리 및 효율성을 위한 AWS 통합 및 도구 강화 워크로드 충족
- 플랫폼 구축 단순화
- 커뮤니티에서 혁신의 플라이휠을 가속화하고 해당 혁신을 고객에게 원할 하게 제공
결론
이 세션의 발표한 기능에 신규 기능 목록은 아래와 같습니다.
- CloudWatch Container Insights with Enhanced Observability
- CloudWatch Network Flow Monitor
- Cedar
- IPv6 (Cluster endpoints)
- Application Recovery Controller (ARC)
- Kube Resource Orchestrator (KRO)
- Amazon EKS Hybrid Nodes
- EKS Cluster Auto Mode
- Amazon EKS Node Health and Auto-Repair
EKS 구축/운영이 훨씬 더 편리해질 수 있는 기능들이 많이 추가되었습니다.꼭 세션을 Youtube로 보실 것 을 강추드립니다. (https://www.youtube.com/watch?v=_wwu0VKy3w4)