[Jump Into ISV] 생성형 AI와 Data Lakehouse에게 별 ⭐⭐⭐⭐⭐개 드립니다
생성형 AI의 등장과 현재

생성형 AI의 거짓말 🤥
RAG는 ‘검색 증강 생성’이라고도 하며, 외부 지식 베이스를 연결해 기존 오류를 줄이고 더 정확한 답변을 제공할 수 있도록 돕습니다. RAG는 다양한 데이터를 검색하여 대규모 언어 모델(LLM)의 응답을 보강하는데, 이 방대한 데이터를 저장하고 관리하는 곳이 바로 데이터 레이크하우스 입니다.
데이터의 창고와 호수? 창고와 호수를 결합한 데이터 레이크하우스
데이터 레이크는 대규모 원시 데이터를 저장할 수 있는 중앙 저장소로, 정형, 반정형, 비정형 데이터를 모두 저장할 수 있습니다. 데이터는 주로 원시 상태로 저장되며, 이는 데이터 분석가와 과학자들이 데이터를 자유롭게 접근하고 처리할 수 있도록 도와줍니다. 데이터 레이크의 주요 장점은 확장성과 유연성입니다.
반면, 데이터 웨어하우스는 정형, 반정형 데이터를 중앙 집중식으로 저장하고 분석하는 시스템입니다. 데이터는 ELT(추출, 적재, 변환) 과정을 거쳐 정제되고 구조화된 형태로 저장됩니다. 데이터 웨어하우스의 주요 장점은 고품질 데이터와 빠른 쿼리 성능입니다.

데이터 레이크하우스는 이러한 데이터 레이크와 데이터 웨어하우스의 장점을 결합한 현대적인 데이터 관리 아키텍처입니다. 데이터 레이크의 유연성과 비용 효율성, 대용량 지원 기능을 데이터 웨어하우스의 데이터 관리 기능과 결합하여, 모든 데이터를 대상으로 비즈니스 인텔리전스(BI)와 머신러닝(ML)을 지원합니다.

인기있는 데이터 레이크하우스 플랫폼
실제로 데이터베이스 관리 시스템을 매월 검색엔진에서의 노출 빈도 등 다양한 요소로 DB를 평가하여 순위를 지정해 주는 사이트 DB엔진 랭킹에서 Snowflake가 데이터 레이크하우스 플랫폼 중 제일 높은 순위에 있습니다.

Snowflake로 생성형 AI를 구축한 사례
소개해드릴 고객사 식신은 월간 350만 명의 사용자가 이용하는 푸드테크 기업입니다.
식신은 100만 개 이상의 맛집 데이터와 월간 350만 명의 방문 데이터를 보유하고 있으며, 오랜 서비스 운영 경험을 바탕으로 트렌드를 반영한 메뉴 기반 인사이트 제공 서비스 구축이 필요해졌습니다.
이를 위해 식신의 데이터와 다양한 이기종 데이터를 통합하여 더욱 매력적인 맛집 및 메뉴 추천 서비스를 제공하고, AI 모델의 해설 기능을 통해 데이터 인사이트 도출이 필요하였습니다.
서비스 도입 과정
고객사는 Amazon S3, Amazon Bedrock 그리고 Snowflake 세 가지 인프라를 활용하여 프로젝트를 구축하였습니다.
Amazon S3는 다양한 데이터의 저장과 관리를 담당하며, 데이터는 Amazon Bedrock의 LLM을 활용한 맛집 및 메뉴 추천 서비스의 핵심 자원이 되었습니다.
Snowflake는 데이터 수집 파이프라인 자동화를 담당하며, Streamlit을 활용하여 조회 기간과 지역 정보를 필터링 후 해당 지역의 맞춤형 레스토랑 및 메뉴 추천, 컨설팅 리포트 확인이 가능해졌습니다.
서비스 도입 이후
지역별 인기 메뉴, 스토리가 있는 메뉴 트렌드, 상황이나 장소에 맞는 테마 데이터, 메뉴별 사용된 식자재 등의 데이터를 실시간으로 확인할 수 있는 분석형 대시보드, 컨텐츠형 위젯, API 등 다양한 형태의 컨텐츠로 제공하게 되었습니다
Snowflake를 쉽게 사용하는 방법
Snowflake의 Premier Partner로 ‘데이터 전문가’ 로서의 사명감을 가지고 고객분들의 데이터 비즈니스 확장을 위해서 도움을 드리고 있습니다.
문의 : 메가존클라우드 Data&AI팀 (mzc_tm_isvsdna@megazone.com)
본 콘텐츠는 메가존클라우드 Data&AI팀 김기석님의 자문을 받아 작성하였습니다.
글 | 메가존클라우드 Strategy & Partnership Group 김태권 매니저