[reinvent 2025] Amazon S3 Vectors를 통한 AI 스토리지 비용 구조의 혁신

Summary

Amazon S3 Vectors는 S3에서 벡터를 저장하고, 조회하고, 쿼리할 수 있도록 기본 지원을 제공합니다.
이 세션에서는 S3 Vectors가 고성능 벡터 데이터베이스를 어떻게 보완하며, 스토리지 및 쿼리 비용을 최대 90%까지 절감하는지 살펴봅니다. 또한 S3 Vectors를 Amazon Bedrock Knowledge Bases 및 OpenSearch Service와 연동하여 더 낮은 비용과 복잡성으로 RAG 및 시맨틱 검색을 구현하는 방법을 알아봅니다.

리인벤트 2025 테크 블로그의 더 많은 글이 보고 싶다면?

AWS re:Invent 2025 Tech Blog written by MegazoneCloud

Overview

  • Title: Transforming AI storage economics with Amazon S3 Vectors
  • Date:  2025년 12월 3일 (수)
  • Venue:  MGM Grand | Level 1 | Grand 119
  • Speaker:
  • Mark Twomey
  • Bijeta Chakraborty
  • Frank Ouyang
  • Industry: Cross-Industry Solutions, Software and Internet

들어가며

이번 세션에서는 Amazon S3 Vectors의 Preview 단계부터 GA까지의 기술적인 개선 과정, 핵심 기능, 성능, 가격 모델을 설명하며, S3 기반 벡터 워크로드 구축 시 고려해야 할 요소들을 체계적으로 소개합니다. 특히 고가용성과 내구성을 유지하면서도 자동 확장 및 고성능 검색 기능을 제공하는 S3 기반 벡터 처리 구조가 실제 운영 환경에서 어떤 효율성을 제공하는지 파악하고자 했습니다.

Amazon S3 Vectors (Preview)

Amazon S3 Vectors는 기존 S3에 벡터 저장과 쿼리를 네이티브로 통합한 최초의 클라우드 객체 스토리지 서비스로, 대규모 벡터 데이터를 비용 효율적으로 보관하면서도 서브초(sub-second) 수준의 빠른 검색을 가능하게 합니다. 2025년 7월에 공개된 Public Preview 단계에서 제공된 전용 Vector API는 대규모 벡터 인덱싱과 고성능 검색을 보다 직관적으로 구현할 수 있도록 설계되었으며, Bedrock Knowledge Bases 및 OpenSearch Service와의 통합을 통해 RAG, 하이브리드 검색 환경도 쉽게 구축할 수 있었습니다.

Public Preview 기간 동안 공개된 성능 지표는 다음과 같습니다.

장기 보관하면서도 기존 벡터 데이터베이스 대비 최대 90%의 비용 절감이 가능했고, 수억~수십억 개의 벡터를 저장하면서도 안정적인 서브초 검색 속도를 유지했습니다. 또한 출시 직후 불과 4개월 만에 고객들은 25만 개 이상의 인덱스를 생성하고, 40억 개 이상의 벡터를 저장, 10억 건이 넘는 검색 요청을 처리하며 서비스의 확장성과 신뢰성을 증명했습니다. 

아래는 고객들이 S3 Vectors를 실제 서비스에 적용하면서 요청한 4가지 주요 기능입니다.

1. 더 낮은 지연 시간
사용자 대상 검색, 추천, 카탈로그 같은 인터랙티브 서비스에는 1ms도 중요하기 때문에 더 빠른 응답속도를 요청했습니다.

2. 더 큰 인덱스 크기
벡터 기반 애플리케이션이 커질수록 인덱스 자체도 훨씬 더 큰 규모를 요구했습니다.

3. 벡터의 빠른 ingestion 속도
소량의 벡터라도 높은 동시성으로 S3 Vectors에 빠르게 업로드되기를 원했습니다.

4. 더 많은 리전 지원 및 데이터, 사용자와의 근접성
규제 요구 사항 충족, 지리적 지연시간 감소 등을 위해 더 가까운 리전에 S3 Vectors가 필요했습니다.

Amazon S3 Vectors (GA)

Preview 이후 4개월 동안 지속적으로 기능을 개선해 최근 GA를 발표했습니다. 주요 구성 요소는  다음과 같습니다.

1. Vector Buckets
벡터 워크로드 전용으로 설계된 새로운 형태의 S3 버킷입니다. 기존 오브젝트 버킷과 다르게 대규모 벡터 저장, 검색, 업로드 요구를 충족하도록 최적화되었습니다.

2. Vector Index
벡터 버킷 안의 데이터 구조이며, 벡터와 해당 메타데이터(ID, timestamp, 장르 등)를 함께 저장합니다. 유사도 검색을 위한 벡터 간 관계를 관리하며,  메타데이터 기반 필터링도 함께 지원합니다.

3. Vector API
업로드, 조회, 삭제, 인덱스 관리 등 벡터 전용 API 세트를 제공함으로써 벡터 기반 애플리케이션을 빠르게 구축할 수 있도록 완전 신규 설계된 API입니다.

S3 Vectors 내부 구조

S3 Vectors는 S3와 동일한 핵심 특징을 공유합니다. S3 Vectors는 S3와 동일한 99.999999999%(11 9s)의 데이터 내구성과 99.99%의 가용성을 제공해 벡터 데이터를 안정적으로 보호합니다. 반복적으로 조회되는 쿼리는 자동으로 캐싱되어 웜 쿼리 지연 시간이 100ms까지 단축되며, 캐시는 몇 분 동안 유지됩니다. 또한 S3와 동일한 탄력성을 갖춰 요청량이 늘어나거나 벡터 수가 1만에서 수백만, 수십억 규모로 증가하더라도 인프라가 자동으로 확장되어 별도의 운영 관리가 필요 없습니다. 전체 아키텍처의 핵심 강점은 단순함으로, 인프라나 클러스터 설정을 신경 쓸 필요가 없는 완전 서버리스 모델이라는 점이 가장 큰 특징입니다.

S3 Vectors 가격

S3 Vectors의 비용 구조는 매우 단순하고 효율적으로 설계되어 있습니다. 먼저 Pay-per-PUT 모델을 기반으로 하기 때문에 벡터 데이터를 업로드할 때만 비용이 발생하며, 사용하지 않는 동안에는 별도의 요금이 청구되지 않습니다. 또한 저장 비용 측면에서는 S3의 저렴한 스토리지 단가를 그대로 활용할 수 있어 매우 높은 비용 효율성을 제공합니다. 마지막으로 쿼리 비용은 쿼리를 실제로 실행할 때만 발생하며 별도의 컴퓨팅 노드를 유지하거나 관리할 필요가 없습니다. 특히 인덱스 규모가 커질수록 더 저렴한 단가(Tier)가 적용되어 대규모 벡터 데이터에서도 비용 최적화를 가능하게 합니다.

S3 Vectors 주요 Integration 

1. Bedrock Knowledge Bases  통합

S3 Vector 버킷을 벡터 스토어로 선택해 Bedrock 또는 SageMaker Studio에서 직접 활용할 수 있습니다. 이를 통해 원본 데이터 처리, 임베딩 생성, 벡터 저장까지 이어지는 전체 파이프라인을 완전 관리형 워크플로우로 구성할 수 있습니다.

2. Amazon OpenSearch 통합

 Amazon OpenSearch와의 통합을 통해 더 낮은 지연 시간과 강력한 하이브리드 검색 애플리케이션을 구축할 수 있습니다. 두 가지 패턴이 있는데, 첫 번째는 S3 Vectors를 백엔드 벡터 스토어로 사용해 비용을 절감하면서 OpenSearch의 하이브리드 검색 기능은 그대로 유지하는 방식이고 두 번째는 성능 중심 패턴으로 벡터를 S3 Vector 버킷에 저장한 뒤 OpenSearch Serverless로 내보내어 하이브리드 검색 기능을 활용하는 구조입니다

결론

인프라 관리 없이도 대규모 데이터와 높은 트래픽을 자동으로 처리할 수 있다는 점에서 S3 Vectors는 실제 서비스 운영에 큰 장점을 제공합니다. 또한 사용량 기반 과금 구조를 통해 불필요한 리소스 비용 증가를 우려하지 않고 효율적인 비용 운용이 가능하다는 점도 중요한 이점으로 작용합니다. 종합적으로, 이 아키텍처는 단순성과 확장성이라는 두 가지의 큰 가치를 바탕으로 향후 다양한 AI 기반 서비스 전반에서 효과적으로 활용될 수 있을 것으로 기대됩니다.
글 │메가존클라우드, AIR Unit, AIR Innovation Team, 송현진 Manager

게시물 주소가 복사되었습니다.