[AWS SUMMIT 2025] Amazon Bedrock을 이용한 이미지 검색서비스의 혁신
들어가며
Amazon Bedrock을 이용한 이미지 검색서비스의 혁신
🎙️하흥수 솔루션즈 아키텍트, AWS
🎙️손광현 R&D 실장, 게티이미지코리아
🗂️ 세션 토픽: 게임,미디어및엔터테인먼트

이번 블로그에서는 GenAI 기반 자연어 검색 기술을 주제로 한 세션을 듣고, 여러분께 실제 도입 사례를 중심으로 기술적 인사이트를 전달드리고자 합니다. 특히 게티이미지코리아가 Amazon Bedrock과 OpenSearch를 활용하여 어떻게 기존 키워드 기반 검색에서 벗어나 의미 기반 이미지 검색으로 전환했는지를 중점적으로 살펴보았습니다. 이번 세션에서 주목할 내용은 의미 기반 검색 전환, OpenSearch 벡터 아키텍처, 그리고 검색 성능 최적화 전략입니다.
검색 서비스의 진화
데이터는 점점 늘어나고 있고 80% 이상의 데이터들은 비정형 데이터입니다. 데이터는 급속히 증가하는 반면, 사방에 흩어져 있어 찾기 더욱 어려워졌습니다. 이러한 상황에서 기존의 키워드 기반 검색은 우리가 원하는 데이터를 쉽게 찾을 수 없다는 한계가 있을 것 같습니다. 데이터의 증가에 따라 원하는 것을 찾기 위해 검색의 정확도는 높이면서 검색 속도 또한 유지해야되는 운영과 튜닝에 대한 부담도 점점 커지고 있습니다.
이에 따른 검색 서비스에 대해 하나씩 살펴보도록 하겠습니다.
1. 키워드 기반 검색 (Lexical Search)

키워드 기반 검색은 문자나 단어가 정확하게 저장이 되어 있으면 그에 일치하는 결과를 가져옵니다. 따라서 이 키워드 기반 검색은 문장의 문맥이나 의미를 이해하지 못하는 구조적 한계가 있습니다.
2. 의미 기반 검색(Semantic Search)

앞에서 말씀드린 키워드 검색 방식은 단어의 정확한 일치 여부에 의존했기 때문에 비슷한 의미의 문장을 제대로 찾기 어려운 구조였습니다. 그러나 의미 기반 검색은 우리가 원하는 데이터를 문맥적 의미가 같다면 그 데이터를 가져올 수 있습니다. 단어들을 벡터라는 값으로 변화하여 의미의 유사도를 기반으로 검색 결과를 가져옵니다. 이러한 벡터 기반 검색이 점점 보편화 되고 있습니다.
3. 멀티 모달 검색 (Multimodal Search)

사용자가 텍스트만으로는 원하는 이미지를 찾는 데 한계를 느꼈다면, 이제는 멀티 모달 이미지 검색이 그 해결책이 됩니다. 이미지, 비디오, 음성까지도 벡터 임베딩이 가능 해 지면서 다양한 형태의 검색들이 가능해졌습니다.
4. 대화형 검색(Conversational Search)

멀티 모달 검색에서 더 나아가서 대화형 검색도 가능해졌습니다. 단일 키워드가 아닌 문맥 전체를 이해하고 마치 사람과 대화하듯이 원하는 검색이 가능해졌습니다.
검색 서비스의 진화

이렇게 검색 서비스는 계속 진화하고 있는 것을 볼 수 있습니다. 이러한 진화의 중심에는 바로 벡터 임베딩(Vector Embedding) 기술이 있습니다. 벡터로 변환된 데이터는 단순 인덱스로는 효율적으로 처리하기 어렵습니다. 벡터 데이터는 벡터 전용 데이터베이스 또는 벡터 검색을 지원하는 검색 엔진이 필요합니다.
Amazon OpenSearch
1. Amazon OpenSearch 란?

Amazon OpenSearch 서비스는 보안 및 운영 효율성을 갖춘 완전 관리형 검색 및 분석 서비스입니다.

그러면서 이제는 기존의 키워드 검색 기능을 넘어, 벡터 데이터베이스로도 자리 잡고 있습니다.

해당 장표는 OpenSearch의 벡터 데이터베이스 아키텍처입니다. 사용자가 요청을 하게 되면, Coordinator Node가 Client 에서 요청을 받아 Data Node로 전달합니다. Data Node는 샤드 단위로, 샤드 안엔 세그먼트 단위로 데이터가 들어 갑니다.
이 아키텍처에서 성능을 좌우하는 중요한 요소는 메모리의 활용입니다. 따라서 검색 지연(latency)을 최소화하기 위해서는 메모리에 최적으로 적재하는 전략이 필요합니다.
2. OpenSearch의 벡터 검색 방식
메모리 최적화 방법을 소개 드리기 앞서, OpenSearch 에서 벡터 검색시 어떤식으로 검색하는지 살펴보겠습니다.

일반적으로 Exact K-NN 방식이 있습니다. 이는 모든 벡터 간의 거리를 정확히 계산하여 가장 가까운 K개의 벡터를 반환하는 방식입니다. 높은 정확도를 보장하지만 데이터가 많아질 수록 성능이 저하될 수 있습니다.
그 대안으로는 Approximate K-NN 방식이 있습니다. 이는 모든 데이터 거리를 계산하는 것이 아닌 그래프(HNSW), 클러스터(IVF) 기반으로 검색하는 방식입니다.

HNSW 와 IVF 방식에 대해 알기 쉽게 설명 드리겠습니다.
HNSW는 마치 지도에서 목적지를 향해 점점 가까운 길을 따라 이동하듯, 여러 단계의 그래프 구조를 통해 가장 가까운 벡터를 빠르게 탐색하는 방식입니다.
IVF는 유사한 데이터를 공통된 바구니(클러스터)에 미리 분류해 담아 두고, 사용자의 질의와 유사한 바구니에서만 검색을 수행하여 검색 범위를 줄이고 속도를 높이는 방식입니다.

다음으로는 IVF와 함께 활용되는 고도화된 메모리 최적화 기법으로 프로덕트 양자화(PQ)에 대해서 설명 드리겠습니다.
PQ는 벡터를 여러 개의 서브 벡터로 분할한 후, 각 서브 벡터를 K-means 클러스터링하여 대표 중심점(centroid)으로 대체합니다. 이처럼 벡터를 압축된 형태로 표현함으로써, 메모리 사용량을 획기적으로 줄이면서도 근접 벡터 검색이 가능하게 됩니다.
3. OpenSearch 성능 최적화
OpenSearch도 메모리 최적화를 위해서 라이트 사이징이 중요한 역할을 합니다.

OpenSearch의 디스크 기반 모드에서는 앞서 설명드린 방식들을 사용하여 벡터를 압축하고, 검색 시 디스크에 저장된 정밀 벡터로 재평가(re-scoring)를 수행함으로써 높은 검색 품질이 유지됩니다. 이 방식은 높은 정확도와 비용 효율성을 모두 요구하는 대규모 벡터 워크로드에 적합하며, 메모리 사용량을 최대 97%까지 절감하면서도 높은 검색 품질 유지가 가능합니다.

실무 환경에서 고려해야 할 OpenSearch 의 성능 최적화 팁을 드리겠습니다.
- Index 단계 최적화
- 새로 고침 간격, 레플리카 비활성화
- 속도 느려지는데에 주 원인
- 인덱싱 쓰레드 수 증가
- 샤딩에 대한 모범사례 준수
- 새로 고침 간격, 레플리카 비활성화
- Search 단계 최적화
- 세그먼트 수 감소
- 인덱스 예열 (Warm Up)
- 저장된 필드 읽기 피하기 -> 불필요한 부가 정보 등
운영 단계에서도 이러한 설정을 병행하면 OpenSearch의 성능을 한층 끌어올릴 수 있습니다.
게티이미지코리아의 자연어 검색 서비스 도입
1. 자연어 검색 서비스 아키텍처

이 아키텍처는 게티이미지코리아의 자연어 검색 서비스 아키텍처입니다.
사용자가 업로드한 이미지는 S3에 저장된 후 base64 인코딩 및 JSONL로 변환되어 S3로 전달되고, Amazon Bedrock Titan 멀티모달 모델을 통해 벡터 임베딩이 생성됩니다. 생성된 벡터는 메타데이터와 함께 OpenSearch에 색인되며, 검색 시 질의는 Claude Haiku로 번역 후 Titan 모델로 임베딩되어 검색에 활용됩니다.
이처럼 OpenSearch를 벡터 데이터베이스로 활용하고, Amazon Bedrock을 통해 LLM 및 임베딩 모델을 유기적으로 연계하는 구조는 향후 GenAI 기반 검색 아키텍처 설계에 있어 강력한 레퍼런스로 작용할 수 있습니다.
2. 자연어 검색 서비스 적용 이후 변화



자연어 검색 도입 이후, 사용자는 문장 한 줄로도 원하는 이미지를 빠르게 찾을 수 있어 검색 만족도와 정확도가 크게 향상되었습니다. 내부적으로는 태깅 부담이 줄어 운영 효율이 높아졌고, 외국어 사용자도 직관적으로 검색 가능해 글로벌 접근성이 개선되었습니다. 이로 인해 CTR은 증가하고, 검색당 페이지뷰는 감소하며 검색 품질과 사용 경험이 전반적으로 개선되었습니다.
마무리하며

이번 세션을 통해 검색 기술이 단순 키워드 매칭에서, 의미를 이해하고 연결하는 방향으로 진화하고 있음을 체감했습니다. 특히 OpenSearch는 이러한 변화를 수용할 수 있는 유연한 아키텍처와 다양한 벡터 검색 알고리즘, 그리고 메모리/디스크 기반 최적화 기능을 제공함으로써 실제 AI 검색 시스템 구축에 있어 강력한 선택지라는 점을 확인할 수 있었습니다.
게임과 콘텐츠 산업처럼 사용자 질의가 복잡하고 다양할수록, 이제는 의미 중심의 검색 체계와 운영 최적화 전략이 필수적입니다. 앞으로 OpenSearch를 활용한 벡터 검색 시스템이 보다 다양한 실무 환경에 도입되길 기대합니다.
글 │ 메가존클라우드, Cloud Technology Unit(CTU), Game SA Team, 윤희준 SA
AWS SUMMIT 2025
전문가의 시선으로 정리된 테크 블로그를 통해
2025년 IT 트렌드의 현재와 미래를 살펴보세요.
테크 블로그 목차 (바로 가기→)