[reinvent 2024] AWS를 활용한 멀티클라우드 관리 중앙화
Summary
AWS를 활용한 멀티클라우드 환경에서의 중앙 집중식 운영 전략을 소개합니다. 이번 세션에서는 AWS Systems Manager와 CloudWatch를 활용하여 멀티클라우드 운영의 효율성과 안정성을 높이는 방법을 다룹니다. 또한, 주요 고객 사례와 실질적인 도구를 통해 복잡성을 해결하고 비용을 최적화하는 방법을 설명합니다.
리인벤트 2024 테크 블로그의 더 많은 글이 보고 싶다면?
Overview
들어가며
이번 세션은 멀티클라우드 환경에서의 운영 비용과 복잡성을 줄이는 방법에 대해 알아보기 위해 신청하게 되었습니다. AWS System Manager와 CloudWatch와 같은 도구를 활용한 사례를 통하여 주요 기술 및 도구가 문제를 어떻게 해결하고 운영 효율성을 어떤식으로 향상시키는지 얻고자하여 신청하게 되었습니다.
Multi-Cloud 운영의 주요 과제
멀티클라우드는 유연성과 확장성을 제공하는 동시에 운영의 복잡성을 가중시키기도 합니다. 다양한 클라우드 제공 업체의 환경마다 다른 API, 보안 정책, 관리 도구가 존재하기 때문에 이를 통합 관리하는 과정은 쉽지 않습니다. 또한, 클라우드 간 데이터 전송에 따른 비용 증가와 성능 문제도 주요 문제 요인 중 하나입니다. 예를 들어, 한 기업에서 두 개의 주요 클라우드 제공 업체를 사용하여 데이터 통합 과정에서 매달 수천 달러의 추가 비용을 지출하고 있는 경우를 볼 수 있습니다. 이러한 문제는 중앙 집중식 관리 도구를 통하여 해결할 수 있으며, AWS는 이러한 요구를 충족하기 위해 System Manager와 CloudWatch와 같은 통합 솔루션을 제공하고 있습니다.
이제 AWS가 제공하는 멀티클라우드 및 하이브리드 환경 지원 기능과 이를 활용하여 복잡한 멀티클라우드 운영 과제를 어떤식으로 해결하였는지 자세히 살펴보겠습니다.
AWS가 제공하는 Multi-Cloud 및 Hybrid 기능
AWS는 2016년 이후 지속적으로 멀티클라우드 지원을 확장하며, 고객 요구사항을 충족시키기 위한 노력을 이어가고 있습니다.
AWS가 멀티클라우드와 하이브리드 환경에서 효과적인 운영을 지원하기 위해 제공하는 주요 기능은 아래와 같습니다.
- AWS Systems Manager : 온프레미스와 다양한 클라우드 환경에서 자산을 통합적으로 관리하며, 중앙 대시보드를 통해 패치 관리, 자산 추적, 작업 스케줄링과 같은 기능을 제공합니다. 이를 통해 복잡한 환경에서도 효율적인 운영이 가능합니다.
- AWS CloudWatch : 클라우드 및 온프레미스 환경의 다양한 지표를 모니터링하고 로그 데이터를 수집하여 운영 상황을 시각적으로 제공합니다. Prometheus와의 연동을 통해 클라우드 데이터를 실시간으로 시각화 및 모니터링 가능하며, 운영 상태를 실시간으로 추적할 수 있는 통합 대시보드를 제공합니다. 이를 통해 문제 발생 시 신속한 대응과 분석이 가능합니다.
- AWS IAM Role Anywhere : 비 AWS 워크로드를 인증하고 AWS 서비스에 보다 안전하게 접근할 수 있는 기능을 제공하고 있으며, 멀티클라우드 환경에서 강력한 인증 및 보안 강화가 가능합니다.
이러한 AWS 서비스들이 실제 운영 환경에서 어떤 방식으로 활용되고, 구체적으로 어떠한 이점을 제공하는지 자세히 살펴보겠습니다.
AWS 서비스 접근 방식
AWS는 서비스 접근을 위해 두 가지 주요 방식을 제공합니다.
- 운영 관리 중심
AWS System Manager를 사용하여 온프레미스 및 클라우드 환경에서 서버와 자산을 중앙에서 관리할 수 있습니다. 이를 통해, 패치 관리, 자산 추적, 작업 스케줄링 등의 작업을 자동화하여 복잡한 환경에서도 운영 효율성을 향상 시킬 수 있도록 돕습니다. 예를들어, Systme Manager 서비스는 서버 등록뿐만 아니라, 패치 상태를 자동으로 추적하고 문제 발생 시 알림을 제공하여 엔지니어들이 반복 작업을 줄이고 중요한 문제 해결에 더 집중할 수 있도록 돕는 사례를 통해 확인할 수 있습니다. - 인증 및 보안강화 중심
AWS IAM Role AnyWhere는 앞서 설명한 바와 같이 비 AWS 워크로드를 인증하고, AWS 서비스에 안전하게 접근할 수 있도록 지원하는데요. VPN이나 Direct Connect와 같은 보안 연결을 통하여 인터넷 연결 없이도 안전한 통신 환경을 제공합니다. 예를들어, Role Anywheres는 멀티클라우드 환경에서도 인터넷 연결 없이 안전한 인증을 가능하게 하여, AWS 서비스 간의 통신을 보안적으로 강화해주는 사례를 통해 확인할 수 있습니다.
데이터 가시성과 실시간 모니터링을 통한 운영 개선
AWS CloudWatch는 멀티클라우드 환경에서 데이터를 실시간으로 수집하고, 시각화 및 모니터링을 제공합니다. 다양한 환경에서 운영 데이터를 통합적으로 관리할 수 있도록 설계되어, 엔지니어들은 운영 상황을 명확히 파악하고 문제 발생 시 빠르게 대응이 가능하도록 구현되고 있습니다.
해당 세션에서는 여러 데모를 통해 멀티클라우드 및 온프레미스 환경과 클라우드 네이티브 환경에서 AWS CloudWatch와 관련 도구들을 활용하는 방안을 보여주었는데요, 해당 부분에 대하여 구체적으로 살펴보겠습니다.
1. 멀티클라우드 및 온프레미스 환경에서의 데이터 통합과 모니터링
CloudWatch 데이터 통합 기능
AWS CloudWatch는 멀티클라우드 환경에서 데이터를 실시간으로 수집하고, 다양한 환경의 데이터를
통합적으로 관리할 수 있도록 설계되었습니다. 이를 통해 엔지니어들은 운영 상황을 명확히 파악하고, 문제 발생 시 빠르게 대응이 가능한 장점을 지니고 있습니다.
Prometheus 연동
오픈소스 모니터링 도구인 Prometheus와의 연동을 통해 멀티클라우드 데이터의 실시간 수집과 시각화를 지원합니다. 이를 통해 분산되어있는 환경에서도 데이터 가시성을 확보할 수 있는 장점을 지니고 있습니다.
통합 대시보드 제공
CloudWatch는 클라우드와 온프레미스 데이터를 하나의 대시보드에서 확인할 수 있어, 운영 상태를 한눈에 파악하고 관리할 수 있습니다. 저는 실제 운영을 담당하는 프로젝트에서 해당 기능을 통해 하이브리드 구조의 인프라의 대시보드를 생성하여 월간보고서 작성에 큰 도움을 받고 있기도 합니다.
2. 클라우드 네이티브 환경에서의 관찰 가능성과 모니터링
CloudWatch는 Prometheus Exporter를 활용하여 Kubernetes 클러스터의 메트릭 데이터를 수집하고, 클러스터 상태를 실시간으로 모니터링할 수 있습니다. 이는 클라우드 네이티브 환경에서 운영 효율성을 높이는데 큰 기여를 하고 있습니다.
OpenTelemetry와 데이터 표준화
OpenTelemetry를 통해 멀티클라우드 및 클라우드 네이티브 환경에서 표준화된 방식으로 데이터를 수집하고, 분석 및 문제 해결 속도를 높일 수 있습니다.
AWS STS와 보안
AWS STS(임시 보안 자격 증명)을 활용해 클라우드 네이티브 환경에서도 데이터 전송을 안전하게 보호합니다.
위와 같이 AWS CloudWatch와 관련 도구들은 다양한 환경에서 데이터의 가시성을 높이고, 안정적이고 효율적인 운영을 위한 필수적인 기반을 제공합니다.
고객 활용 사례
마지막으로, AWS 솔루션은 실제로 멀티클라우드 환경에서 다양한 문제를 해결하며 효율성을 극대화하고 있는 과정으로, 대표적인 고객사례를 소개하였습니다.
- Phillips 66의 운영 성과
Phillips 66는 5,000개 이상의 서버를 Kubernetes 기반으로 운영하며, 개인화된 대시보드를 통해 운영 효율성을 극대화하였으며, Amazon Managed Grafana와 Amazon Managed Prometheus를 활용하여 평균 문제 해결 시간(MTTR)을 30% 단축하였습니다. - RSpace의 서버 관리 사례
Systems Manager를 통해 100,000개 이상의 서버를 효율적으로 관리하여, 대규모 서버 환경에서 안정적이고 체계적인 관리를 구현하였습니다.
이러한 사례들은 AWS서비스가 다양한 산업군에서 운영 효율성을 크게 향상시키고, 대규모 환경에서도 안정적이고 효과적인 관리 솔루션을 제공하고 있음을 보여주었습니다.
결론
멀티클라우드는 유연성과 확장성을 제공하지만, 동시에 관리와 운영의 복잡성이라는 도전을 요구한다는 점을 느꼈습니다. 특히 다양한 클라우드 환경을 통합적으로 관리하고 실시간으로 데이터를 파악하는 것이 중요하지만 쉽지 않은 과제라는 생각이 들었습니다.
이번 세션에서는 AWS Systems Manager와 CloudWatch가 이런 복잡성을 어떻게 해결하는지 알 수 있었습니다. Systems Manager의 자동화 기능은 멀티클라우드 환경에서 운영 작업을 단순화하고, CloudWatch는 실시간 데이터 통합을 통해 여러 클라우드의 상태를 한눈에 파악할 수 있도록 지원하는 핵심 도구임을 확인하였습니다.
이 도구들은 관리 효율성을 높이고 전략적 의사 결정을 돕는 중요한 기반이며, 이를 잘 활용하면 복잡한 환경에서도 안정성과 유연성을 확보할 수 있다는 확신이 들었습니다. 앞으로 아키텍처 설계 및 운영 과정에서 이 도구들을 어떻게 적용할지 더 고민해봐야겠다고 느꼈습니다.