[Tech Blog] AWS Well-Architected Review로 시작하는 클라우드 운영 진단과 개선

MegazoneCloud

AWS Well-Architected Review로 시작하는
클라우드 운영 진단과 개선

MegazoneCloud
※ 해당 테크 블로그는 작성자의 허가를 받고 리포스팅 되었습니다. ※

들어가며

최근 한 고객사를 대상으로 AWS Well-Architected Review(이하 WAR)를 수행했습니다. 해당 고객은 AWS 인프라 구성한 조직과 현재 운영하고 있는 조직이 달랐고 비용이슈나 보안상 위험 등 여러 운영 과제를 안고 있었습니다. AWS WAR를 통해 고객은 빠르게 운영 환경의 리스크를 파악하고 개선방안을 찾을 수 있었습니다. 이번 글에서는 AWS WAR가 무엇인지 소개하고, 실제 고객 사례를 바탕으로 인프라 운영 관점에서 WAR가 제공하는 실질적인 이점을 살펴보겠습니다.

AWS Well-Architected Review란?

AWS는 ‘AWS Well-Architected Framework’라는 이름으로 클라우드 아키텍처의 모범 사례(Best Practice)를 정리하여 공개하고 있습니다. 이 프레임워크는 클라우드 워크로드를 안정적이고 효율적으로 운영할 수 있도록 설계되었으며, 이를 바탕으로 사용자는 현재의 클라우드 환경을 점검하고 개선 방향을 찾을 수 있습니다. WAR는 이러한 프레임워크 기반의 진단 과정을 말하며, AWS 콘솔에서 직접 수행하거나 파트너를 통해 지원받을 수 있습니다.

AWS Well-Architected Framework 소개

AWS Well-Architected Framework는 6개의 핵심 원칙(Pillar)로 구성되어 있습니다. 각 원칙은 시스템을 운영하고 최적화하기 위해 중점적으로 고려해야 할 영역을 나타냅니다. 원칙 별로 체크 리스트가 준비 되어있으며 사용자는 질문에 답하면서 클라우드 환경과 시스템의 강점 및 취약점을 파악할 수 있습니다. 


1. 운영 우수성 (Operational Excellence)
시스템이 정상적으로 운영되고 문제 발생 시 빠르게 대응할 수 있는 지를 확인합니다. 예를 들어 AWS CloudWatch 를 활용하여 운영 현황을 실시간으로 모니터링하고, 이벤트 발생 시 자동으로 알림 또는 조치를 실행하는 경우를 들 수 있습니다. 

2. 보안 (Security)
보안 사고 예방을 위해 데이터 보호, 시스템 접근 통제, 취약점 방지 등의 조치가 취해졌는지 검토합니다. 예를들어 IAM으로 최소 권한을 적용하고, AWS KMS로 데이터를 암호화합니다.

3. 안정성 (Reliability)
장애 발생 시 시스템이 빠르게 복구되고, 지속적으로 서비스가 제공될 수 있도록 설계되었는지를 의미합니다. Amazon Route 53과 ELB를 활용해 장애 발생 시 자동 트래픽 전환이 가능하도록 멀티-AZ를 구성하는 경우가 있습니다.

4. 성능 효율성 (Performance Efficiency)
리소스를 효과적으로 사용하여 다양한 트래픽 변동에 대응하는 능력입니다. 예를 들자면, Amazon EC2 Auto Scaling으로 트래픽에 따라 인스턴스를 자동으로 늘리거나 줄이도록 설정합니다.

5. 비용 최적화 (Cost Optimization)
불필요한 비용을 제거하고, 적절한 크기의 리소스를 사용하는 것을 목표로 합니다. AWS Compute Optimizer 로 최적화 옵션을 선택하거나, Amazon S3의 Intelligent-Tiering을 통해 스토리지 비용을 절감하는 예를 들 수 있습니다.

6. 지속가능성 (Sustainability)
환경에 미치는 영향을 줄이고 친환경적인 운영 방향으로 자원을 운영합니다. 서버리스 아키텍처(AWS Lambda, API Gateway 등)를 사용하여 리소스 낭비 없이 필요한 만큼만 컴퓨팅 자원을 소비하도록 설계하는 경우를 들 수 있습니다.

👉🏻 AWS Well-Architected 페이지

WAR 수행 프로세스

WAR는 다음 과정을 거치게 됩니다. 각 단계 별 예시화면을 통해 진행과정을 알아보겠습니다.

1. 워크로드 등록

Well-Architected Tool → [Define Workload] 클릭 → 워크로드 정보 입력
워크로드 이름, 설명, 리뷰 책임자(Review owner) 환경(예: Production, Pre-Production), 리전 등의 정보를 입력하여 리뷰를 진행할 워크로드 정보를 등록합니다.

이후 Profile과 Lens를 등록하게 됩니다. Profile은 리뷰할 워크로드의 클라우드 도입단계, 비즈니스 가지, 운영 라이프사이클 등의 정보를 추가로 입력합니다. 


Lens 등록은 GenAI, Serverless, 헬스케어 등 AWS가 제공하는 분야별 또는 산업별 기준을 추가하거나 맞춤 기준을 적용하여 좀 더 세밀하게 워크로드를 진단할 수 있습니다. 편의를 위해 Profile 과 Lens 등록 페이지는 넘어갔습니다.

2. 리뷰 진행

Well-Architected Tool → Workloads →  [Continue reviewing] → 체크리스트 답변

신규로 생성한 워크로드에 들어가면 사전에 기입한 정보를 볼 수 있습니다. 이후 [Continue reviewing] 버튼을 클릭하여 점검항목들을 확인하고 해당사항을 체크합니다.


워크로드 리뷰페이지 좌측 패널에는 WAR의 6가지 핵심 원칙(Pillar)과, 원칙 별로 사전에 정의된 주요 질문들이 있습니다. 중앙에는 질문별 세부 체크리스트 항목이 나오며, 우측 Helpful Resource 의 설명과 관련 자료를 참고하여 해당사항에 체크합니다. 예를 들어 비용 최적화 1번 항목(기호- COST 1)의 “클라우드 재무 관리를 어떻게 구현합니까?” 의 질문의 체크리스트를 검토합니다. ‘비용 최적화 책임자 설정’, ‘재무와 기술 간의 파트너십 수립’, ‘클라우드 예산 및 예측 수립’ 등의 세부 항목 중에서 해당사항을 검토합니다. 이 단계는 단순한 체크리스트를 넘어, 클라우드 운영 경험이 부족한 조직에게는 가이드 역할도 수행합니다. 

답변이 완료 되면 [저장 및 종료]를 클릭합니다. 리뷰 중간에도 저장이 가능하며, 언제든지 수정하여 반영할 수 있습니다.

3. 결과 확인 및 개선 계획 수립

Well-Architected Tool → Workloads 선택 →  Lens → 해당 렌즈 선택 → 결과 확인
검토가 마무리 되면 즉시 WAR 평가 결과를 확인 할 수 있습니다.


해당 페이지의 [개선 계획(Improvement plan)] 탭에서는 High Risk Issue(HRI) 또는 Medium Risk Issue(MRI) 이슈와 해당 이슈의 개선 방법을 한눈에 파악 할 수 있습니다. 개선 계획은 리스크 별, 핵심 원칙(Pillar) 별로 구분하여 확인할 수 있으며 AWS 에서 권장하는 방법과 해당 문서의 링크 또한 제공합니다. 예를들어 비용 최적화(Cost Optimization) Pillar > ‘COST 7. 비용 절감을 위해 가격 결정 모델을 어떻게 사용합니까?’ 항목이 높은 수준의 리스크로 식별되었다면, ‘요금 모델 분석 수행’, ‘비용을 기준으로 리전 선택’ 등의 권장되는 개선 항목을 함께 확인 할수 있습니다.

또한, 해당 렌즈 선택 후 [보고서 생성(Generate Report]을 클릭하면 다음 예시 이미지와 같이 검토 결과에 대한 PDF 형식의 보고서도 다운로드 받을 수 있습니다.


메가존클라우드는 고객의 필요에 따라 별도의 리포트 요약본도 제공하고 있습니다. 특히, 보안이나 비용과 같이 우선순위가 높은 항목에 대해서는 구체적인 구현 우선순위를 제시하는 등의 액션 플랜 중심의 지원도 가능합니다.

실제 고객 사례: WAR를 통한 인프라 개선

WAR 수행 이후 도출된 권장 사항을 실제 워크로드에 반영함으로써 운영 환경을 전반적으로 개선할 수 있습니다. 메가존클라우드와 함께 WAR를 진행한 고객사는 퍼블릭 서브넷에 리소스가 배치되어 있었던 보안 이슈와, 리소스의 과소 또는 과다 프로비저닝으로 인해 발생할 수 있는 비용 및 성능 리스크 등을 식별할 수 있었습니다. 메가존클라우드는 고객사의 상황에 맞춘 리포트를 제공하고, 담당자가 내용을 빠르게 이해할 수 있도록 별도의 인터뷰 세션도 함께 지원했습니다. 

이를 바탕으로 고객사 내부적으로는 리소스의 용도를 재점검하고, 사용량을 주기적으로 모니터링해 사이징을 최적화 할 뿐 아니라 불필요한 리소스를 정리할 예정입니다. 또한 메가존클라우드와 함께 리소스를 프라이빗 환경으로 재배치하고, WAF 등 보안 설정을 강화하는 방향으로 단계적인 개선을 논의하고 있습니다.

WAR는 어떻게 진행할 수 있을까?

AWS Well-Architected 리뷰는 두 가지 방식으로 진행할 수 있습니다.


직접 수행:
AWS 콘솔의 Well-Architected Tool을 통해 누구나 무료로 리뷰를 시작할 수 있으며, AWS가 제공하는 6가지 핵심 원칙(Pillar)에 따라 질문에 답하면서 워크로드 상태를 직접 평가하고 개선 권장사항을 확인할 수 있습니다. 다만, 질문 해석이나 리스크 판단이 어려운 경우도 있으므로 경험이 적은 사용자라면 인사이트가 제한적일 수 있습니다.

파트너와 함께 수행: 
AWS 인증 파트너는 고객의 환경을 분석하고, 보다 구조적인 리뷰를 통해 실질적인 개선 계획까지 함께 수립할 수 있도록 지원합니다. 경우에 따라 AWS로부터 수천 달러 상당의 크레딧을 제공받아 개선 작업에 사용할 수 있는 이점도 있습니다.



메가존클라우드와 함께 WAR 를 수행하면 단순히 현황 진단을 넘어, 실질적인 실행 단계의 컨설팅까지 받을 수 있습니다. 나아가 고객의 비즈니스 목표와 예산, 조직 구성에 따라 현실적인 실행 전략을 함께 수행하며, 클라우드 운영 역량 내재화까지 지원 가능합니다.

마무리하며

WAR는 단순한 진단 도구를 넘어 클라우드 환경을 전략적으로 운영하고 최적화하는데 필요한 프레임워크입니다. 인프라 운영 조직이 바뀌었거나, 리소스 비용이 예상치보다 증가하는 경우 등 다양한 이슈 상황에서 WAR를 통해 빠르게 문제를 발견하고 개선 방향을 잡을 수 있습니다.

메가존클라우드의 전문 인력과 함께 효과적인 WAR 진단과 개선을 희망하신다면, 문의해 주세요.

👉🏻 온라인 상담 문의


글 | 메가존클라우드, Cloud Tech Unit, AWS Account SA 정은영 매니저

Technical Review |
  • 메가존클라우드, Cloud Tech Unit, AWS Account SA 박상위 매니저
  • 메가존클라우드, Cloud Tech Unit, AWS Delivery SA 김시언 매니저
게시물 주소가 복사되었습니다.

이런 콘텐츠도 있어요!