[Jump Into ISV] AI 시대의 인프라 운영, Datadog이 제시한 새로운 기준 – DASH 2025 Korean Track 리캡

DASH 2025

Datadog이 주최한 연례 컨퍼런스 DASH 2025는 관측성과 보안, 그리고 인공지능 기술의 통합이라는 중요한 전환점을 제시했습니다. 특히 Korean Track에서는 국내 기술 전문가들과 함께, AI 기반 모니터링과 DevSecOps 자동화의 실질적인 활용 사례와 신규 기능이 심도 있게 다뤄졌습니다.

🔍 AI Observability, 이제는 선택이 아닌 필수

이번 DASH 2025에서 Datadog은 단순 모니터링을 넘어 AI 모델의 생애주기 전반을 추적·분석할 수 있는 기능들을 대거 발표했습니다.

주요 발표 내용:

  • LLM Observability: 프롬프트 흐름 추적, 성능 실험, 비용 및 품질 측정
  • AI Agents Console: 조직 내 AI 도우미 사용 현황 및 ROI 분석
  • GPU Monitoring: 워크로드 수준 GPU 자원 최적화
  • MCP Server: AI 에이전트가 Datadog API를 자연어로 호출하여 데이터 조회

Datadog의 AI Observability는 AI가 ‘어떻게 작동했는지’뿐 아니라 ‘왜 그런 결과를 냈는지’까지 파고드는 디버깅 경험을 제공합니다.

⚙️ Bits Agent – 운영 자동화의 핵심

Datadog은 ‘Bits’라는 이름으로 역할 기반 AI 에이전트 시리즈를 소개했습니다.

에이전트 종류주요 기능
Bits SRE인시던트 감지 → 원인 분석 → 대응 → 회고까지 자동화
Bits Dev로그·메트릭 분석 후 PR 생성, 코드 수정 제안
Bits AnalystSQL 없이도 자연어로 데이터 분석 및 시각화
Bits Security AnalystCloud SIEM + MITRE 기반 AI 분석으로 보안 위협 탐지

이러한 에이전트는 단순한 모니터링을 넘어, 운영 팀과 개발 팀의 생산성을 극대화하면서 인시던트 대응 시간을 단축해줍니다.

🛡️ AI 보안, 이제는 본격적인 대응이 필요하다

Datadog은 AI 에이전트 위한 보안 제품을 다음과 같이 제안합니다.

  • Code Security: 에이전트의 코드 변경 및 권한 추적
  • Cloud SIEM: 실시간 위협 탐지 및 분석
  • Sensitive Data Scanner: 민감 정보 노출 방지
  • Workload 보안: 파일/프로세스/악성코드 탐지
  • LLM Observability: 프롬프트의 의도 및 결과 감시

🧰 실전에서 유용한 기능도 대거 등장

이번 발표에서는 AI 중심 기능 외에도 실무에 바로 활용 가능한 기능들이 소개되었습니다:

  • Internal Developer Portal: 개발자 셀프서비스 기반 플랫폼 운영
  • APM Latency Investigator: 지연 이슈 Root Cause 분석 자동화
  • Proactive App Recommendations: 성능 개선 포인트 자동 제안
  • CloudPrem & Flex Archive Search: 보안/컴플라이언스 강화를 위한 로그 저장 및 분석

✨ 마무리: Observability의 미래는 AI와 함께

DASH 2025는 단순한 기능 소개에 그치지 않았습니다. Datadog은 모든 운영은 관측 가능해야 하며, 그 관측은 점점 더 AI와 가까워지고 있다는 방향성을 명확히 제시했습니다.
DevOps, SRE, 보안팀, 데이터팀 모두에게 의미 있는 발표였고, AI를 두려워하기보다는 활용할 수 있는 도구로 받아들이자는 메시지가 깊이 와닿는 자리였습니다.
메가존클라우드에서는 Datadog 최신 기술 상담 및 자체보유한 전문 엔지니어 조직을 통해 신규 도입에서부터 구축 및 최적화 관련 기술 지원을 도와드리고 있습니다. 많은 관심 부탁드립니다.
감사합니다.


글 │ 메가존클라우드 마케팅 유닛 김찬희 매니저

게시물 주소가 복사되었습니다.

이런 콘텐츠도 있어요!