이 세션은 로컬 NVMe 스토리지가 제공하는 초저지연과 고성능의 이점, 그리고 이를 뒷받침하는 최신 EC2 인스턴스와 자체 개발한 Nitro SSD 기술을 소개합니다. 또한, 성능 병목 현상을 정밀하게 분석할 수 있는 ‘향상된 메트릭’과 컨테이너 환경(Kubernetes)에서의 로컬 스토리지 통합을 위한 CSI 드라이버 등 최신 기능을 공유합니다.
AWS re:Invent 2025 Tech Blog written by MegazoneCloud
Overview
Title: Maximizing EC2 Local NVMe Storage: Enhanced NVMe Metrics and K8s Integration
Date: 2025년 12월 3일 (수)
Venue: MGM | Level 3 | Room 353
Speaker:
Amit Shah
Industry: Government
들어가며
고성능 애플리케이션을 운영할 때 스토리지 I/O 성능은 전체 시스템의 병목이 되는 경우가 많습니다. 특히 데이터베이스나 분산 파일 시스템처럼 빠른 응답 속도와 높은 처리량을 요구하는 워크로드에서는 더욱 그렇습니다. 이번 칼럼에서는 EC2 인스턴스에 직접 연결된 고성능 로컬 NVMe 스토리지(인스턴스 스토어)의 성능을 극대화하는 방법과 이를 위한 새로운 기능들을 살펴보도록 하겠습니다.
고성능 워크로드를 위한 EC2 포트폴리오와 Nitro SSD 아키텍처
AWS는 스토리지 최적화 인스턴스를 ‘고성능’과 ‘고밀도’ 두 가지 트랙으로 제공합니다. 고성능을 위한 I7i(인텔 기반)와 I8g(Graviton4 기반)는 이전 세대 대비 컴퓨팅 성능과 스토리지 I/O 성능을 대폭 향상시켰습니다. 반면, 테라바이트당 비용 효율성을 중시하는 고밀도 워크로드를 위해 I7ie와 I8ge 인스턴스를 제공하며, 이는 최대 120TB의 로컬 스토리지를 제공합니다. 이러한 성능의 핵심에는 AWS가 자체 개발한 Nitro SSD가 있습니다. 기존 OEM SSD와 달리, Nitro SSD는 ‘Nitro 스토리지 컨트롤러’와 ‘미디어 카드’를 물리적으로 분리한 아키텍처를 채택했습니다. 이를 통해 AWS는 스토리지 컨트롤러에서 중앙집중식 FTL을 실행함으로써 성능 가변성을 줄이고, 장애 발생 시 신속한 디버깅 및 업데이트를 가능하게 했습니다.
Kubernetes(K8s) 환경을 위한 CSI 드라이버
많은 고객이 EKS 등 컨테이너 환경에서 로컬 NVMe 스토리지를 사용할 때 관리의 어려움을 겪어왔습니다. 이를 해결하기 위해 AWS는 로컬 인스턴스 스토리지를 위한 CSI(Container Storage Interface) 드라이버를 2026년 1분기에 출시할 예정입니다. 이 드라이버는 아래와 같은 세 가지 핵심 기능을 제공합니다.
안전한 데이터 삭제(Secure Data Erasure): 파드(Pod) 삭제 시 암호화 키를 파기하는 방식 등을 통해 데이터를 안전하게 지웁니다.
다중 볼륨 지원: 하나의 인스턴스에서 최대 192개의 볼륨을 생성하여 여러 파드에 할당할 수 있습니다.
성능 격리: 볼륨 간 성능 간섭을 방지하여 공정한 성능을 보장합니다.
향상된 관측성(Observability)과 로컬 부트(Local Boot)
기존의 1분 단위 CloudWatch 메트릭으로는 순간적인 성능 스파이크나 지연 시간의 원인을 파악하기 어려웠습니다. 이에 AWS는 1초 단위의 정밀한 메트릭과 I/O 크기별 지연 시간 히스토그램 기능을 도입했습니다. 이를 통해 사용자는 특정 크기의 I/O가 전체 시스템 성능에 미치는 영향을 쉽게 파악하고 분석할 수 있습니다. 마지막으로 소개된 ‘로컬 부트(Local Boot)’ 기능은 EBS가 아닌 로컬 NVMe 스토리지에서 인스턴스를 부팅할 수 있게 해줍니다. 이는 미션 크리티컬한 애플리케이션이 외부 서비스(EBS)에 대한 의존성을 제거하고, 재부팅 시 더 빠른 속도를 확보할 수 있도록 지원합니다.
결론
이번 세션은 EC2 로컬 NVMe 스토리지가 단순한 하드웨어 제공을 넘어, Nitro SSD 아키텍처를 통한 신뢰성 향상, CSI 드라이버를 통한 Kubernetes 통합 편의성 제공, 그리고 향상된 메트릭을 통한 깊이 있는 성능 분석 도구까지 제공하는 종합적인 플랫폼으로 진화했음을 보여주었습니다. 초저지연과 고성능이 필수적인 워크로드를 운영하는 엔지니어라면 I7i, I8g 등 최신 인스턴스와 함께 이러한 새로운 기능들을 적극적으로 활용하여 인프라의 성능을 극대화할 수 있을 것입니다.
글 │메가존클라우드, Specialty Service Unit, Modernization SA 1팀, 박혜진 SA