[reinvent 2024] Amazon EKS fleet 관리에 대해 자세히 알아보기

Summary

GitOps 원칙을 사용하여 Amazon EKS 클러스터를 환경 전반에 걸쳐 통합된 내부 개발 플랫폼을 만드는 방법을 배웁니다. 다중 클러스터 리소스 구성, 드리프트 감지, 수명 주기 관리를 통해 기술을 연마하고 동시에 규정 준수와 보안을 보장합니다. 플랫폼 엔지니어링을 구현하여 리소스 상태를 일관되고 유지하고, 클러스터 전반에 정책을 적용하여, 로그, 메트릭, 모니터링 및 액세스 제어를 중앙 집중화 하는 기술을 Workshop을 통해 배울 수 있습니다.

리인벤트 2024 테크 블로그의 더 많은 글이 보고 싶다면?

Tech Blog

AWS re:Invent 2024 Tech Blog written by MegazoneCloud

Overview

Title: Dive deep into Amazon EKS fleet management [REPEAT]
Date: 2024년 12월 4일(수)
Venue: MGM Grand | Level 3 | Premier 311
Speaker:
Sebastien Allamand(Sr. Specialist Solutions Architect, AWS)
Carlos Santana(Sr. Specialist Solutions Architect, AWS)
Industry: Cross-Industry Solutions

들어가며

이 세션은 워크샵이지만 EKS Fleet Management 라는 단어가 있어 바로 신청을 하게 되었습니다.
EKS Fleet Management는 다중 클러스터 환경에 효율적으로 관리하는 개념 및 접근 방식입니다.
이 스킬을 익힌다면 더 성장할 수 있는 나의 모습을 볼 수 있을 것 같습니다.

EKS의 성장

2024년 7월 기준, Amazon EKS는 빠르게 채택되고 있으며, 관리되는 클러스터 수가 전년 대비 33.1% 증가하고 있습니다.

그러나 더 많은 클러스터를 생성해야 하고 복잡성이 증가하고 다양한 파이프라인과 다른 버전이 생성되면서 관리가 불가능한 성장을 이루어 내고 있습니다.

결과적으로 클러스터의 일관성을 유지하기 어려워 지고 있습니다.

필요

EKS Fleet Management의 장점은 아래 3가지가 있습니다.

속도
가용성
효율성

위의 문제를 해결 하기 위해서는 EKS 클러스터에 배포되는 Kubernetes 리소스에 대해 GitOps 사용하는 것을 권장합니다.

장점은 아래와 같습니다.

원하는 상태가 선언적으로 표현됩니다. -> 복잡성 감소
불변 상태 유지 -> 감사 기능 강화
에이전트가 원하는 상태를 가져옴 -> 보안 강화
에이전트가 지속적으로 관찰하고 조정 -> 일관성 강제화

GitOps는 누군가 실수로 콘솔에서 변경을 하더라도 GitOps 에이전트가 복구하고 원래 상태로 되돌릴 수 있는 장점이 있습니다.

실습 환경은 위의 그림과 같습니다.

실제 워크숍에서는 허브 앤 스포크/푸시 GitOps 에이전트 및 풀(애드온, 플랫폼, 애플리케이션) 배포 아키텍처를 선택했습니다. 이 아키텍처는 ArgoCD와 같은 중앙 집중식 GitOps 도구로 많은 수의 EKS 클러스터를 관리할 때 발생할 수 있는 확장성 문제를 해결하도록 설계되었습니다.