[reinvent 2025] [신규 출시] Amazon CloudWatch의 최신 기능

Summary

Amazon CloudWatch가 데이터를 기반으로 더 빠르고, 간편하며, 자율적으로 의사결정을 내릴 수 있도록 지원합니다. 데이터 수집과 분석 워크플로우를 간소화하고, 새로운 AIOps 기능까지 활용하는 방법을 소개합니다.

리인벤트 2025 테크 블로그의 더 많은 글이 보고 싶다면?

AWS re:Invent 2025 Tech Blog written by MegazoneCloud

Overview

  • Title: [NEW LAUNCH] What’s new with Amazon CloudWatch
  • Date:  2025년 12월 4일 (목)
  • Venue:  MGM Grand | Level 1 | Grand 122
  • Speaker:
  • Wei Tao
  • Natt Tichenor
  • Nikhil Dewan
  • Industry: Cross-Industry Solutions

들어가며

클라우드 환경이 복잡해지고, 애플리케이션과 AI 워크로드가 다양해짐에 따라, 단순한 모니터링만으로는 운영 문제를 신속하게 파악하고 대응하기 어렵습니다. Amazon CloudWatch는 이러한 요구를 충족시키기 위해 지속적으로 진화해왔으며, 이번 업데이트에서는 데이터 수집, 분석, AI 기반 의사결정, Generative AI 워크로드 모니터링까지 통합된 기능을 제공합니다. 이번 글에서는 CloudWatch의 최신 기능과 활용 방법을 중심으로 운영 효율과 시스템 안정성을 높이는 방법을 살펴보겠습니다.

What’s new in Amazon CloudWatch

Amazon CloudWatch는 텔레메트리 데이터를 수집하고, 운영 결정을 지원하며, 더 나은 시스템을 구축하도록 돕는 관찰 플랫폼입니다. 이번 세션에서는 네 가지 영역을 중심으로 CloudWatch의 신규 기능에 대해서 소개합니다.

안정적인 관찰 데이터 기반 구축

데이터로 의미 있는 결과를 만들려면, 무엇보다 먼저 데이터를 수집하고 접근할 수 있어야 합니다. 많은 고객들이 보안, 관찰(Observability), 감사(Audit)라는 서로 다른 사일로에서 동일한 데이터를 중복 저장하면서, 비용 증가뿐만 아니라 데이터 누락과 불일치 문제까지 겪고 있습니다. 데이터 저장 방식을 통합해 단일 스토어로 운영하면, 이러한 문제들을 훨씬 효율적으로 해결할 수 있습니다.

데이터를 활용한 인사이트 도출

통합 데이터 스토어 구현을 위해 CloudWatch는 데이터 수집, 큐레이션, 저장, 분석을 지원합니다.

CloudWatch Pipelines

 AWS 리소스, 고객 애플리케이션, 서드파티 데이터 소스를 Seamless하게 수집할 수 있으며, 시각적 파이프라인 빌더로 데이터 변환과 큐레이션을 손쉽게 수행할 수 있습니다.

S3 Table 연동

몇 번의 클릭만으로 CloudWatch 데이터를 S3 Tables와 연동할 수 있으며, Iceberg 테이블 포맷을 지원하여 SageMaker Unified Studio 등 다양한 분석 도구에서 즉시 쿼리하고 활용할 수 있습니다.

필드 인덱스(Field Indexes)

주요 로그 속성(request ID, transaction ID 등)을 인덱싱하여 쿼리 성능을 높이고 필요한 데이터만 스캔할 수 있습니다.

CloudWatch는 수집된 데이터를 기반으로 다양한 계층에서 분석 인사이트를 제공합니다. 

Application Signals(Application Map)

애플리케이션과 API를 자동으로 발견하고 요청량, 지연, 오류 등 표준 지표 기반 대시보드를 제공합니다. Application Map은 전체 애플리케이션을 중앙 시각화 뷰로 보여주어 문제 서비스와 변화 사항을 즉시 파악하고 근본 원인을 분석할 수 있습니다.

모바일용 Real User Monitoring

CloudWatch RUM(Real User Monitoring)과 CloudWatch Synthetics를 통해 웹과 모바일 사용자 경험을 모니터링합니다. RUM은 사용자 활동과 성능 저하, 오류를 추적하고, Synthetics는 카나리 테스트로 가용성 문제를 사전 확인합니다.

Log Facets

새롭게 제공된 Log Facets 기능을 사용하면 복잡한 쿼리 작성 없이도 데이터 소스나 중요 필드(서비스, 심각도 등)를 기준으로 로그 분포를 직관적으로 파악할 수 있습니다. 로그 그룹을 일일이 선택하지 않아도 전체적인 현황을 한눈에 볼 수 있다는 점이 특징입니다.

AI 기반 의사결정 가속화

CloudWatch는 AI를 활용하여 운영 의사결정을 더욱 빠르고 정확하게 할 수 있도록 지원합니다.

CloudWatch Investigation

Generative AI 기반 운영 도구로, Investigate 버튼만 클릭하면 즉시 문제 조사를 시작할 수 있습니다. AI가 관련 리소스와 텔레메트리를 자동으로 연관 지어 근본 원인을 추론하고, 조사 계획과 다음 단계까지 제안합니다. 조사 후에는 Incident Report와 Five Whys 분석이 자동 생성되어 팀 학습과 회고까지 지원합니다.

CloudWatch MCP

특수 에이전트 구축이나 기존 에이전트와 통합을 지원하며, Application Signals MCP 서버와 연결 시 지연 오류나 SLO 위반의 정확한 파일, 함수, 코드 라인을 신속히 식별할 수 있습니다.

Gen AI 워크로드 모니터링 및 개선

CloudWatch는 자체 Generative AI 워크로드를 안전하고 확장 가능한 환경에서 모니터링하고 성능을 개선할 수 있는 기능을 제공합니다.

Generative AI Observability

모델 호출, 토큰 사용량, 지연, 스로틀링, 오류 등 핵심 메트릭을 실시간으로 추적할 수 있으며, Bedrock Agents, LangChain, CrewAI 등 주요 프레임워크와 통합됩니다.

AI Core Evaluations

생성형 AI 에이전트의 정확성, 안전성, 일관성을 검증하는 기능입니다

3개의 사전 구축된 평가 지표(Evaluators)와 사용자 정의 기준을 활용해 모델의 품질을 자동으로 측정하고 모니터링할 수 있습니다. 모든 데이터는 CloudWatch 통합 대시보드에서 확인 가능하며, 세션 기반 추적과 프롬프트-응답 상호작용 분석으로 에이전트와 사용자 상호작용을 세밀하게 모니터링하고 문제를 신속히 파악할 수 있습니다.

결론

이번 업데이트를 통해 Amazon CloudWatch는 단순한 모니터링 도구를 넘어, 데이터 수집부터 분석, AI 기반 의사결정, Generative AI 워크로드 개선까지 아우르는 통합 관찰 플랫폼으로 진화했습니다. 신규 기능들을 활용하면 운영 효율을 높이고, 문제 대응 속도를 단축하며, AI 시스템 성능까지 체계적으로 관리할 수 있습니다.
글 │메가존클라우드, AIR Unit, AIR Innovation Team, 송현진 Manager

게시물 주소가 복사되었습니다.