[Snowflake Data Cloud Summit 2024] BUILD A RAG-BASED LLM ASSISTANT USING STREAMLIT AND SNOWFLAKE CORTEX AI , AI305


장소:
Basecamp, North, Hall F

스피커:
CARLOS CARRERO(Global Principal Architect AI/ML – Partners, Snowflake) / DASH DESAI(Lead Developer Advocate, Snowflake)
최근 고객들이 AI, LLM 에 대한 관심도가 높아지고 저 또한 관심이 많은 서비스라 소개해 드리고 싶은 마음에 해당 세션을 듣게 되었습니다.
이번 세션에서는 Snowflake의 Streamlit을 사용하여 간단한 검색 증강 생성(RAG) 애플리케이션을 만드는 핸즈온 랩이 진행되었습니다.
Snowflake 기본 임베딩 기능을 사용하여 PDF 문서를 읽고, 청크하고, 벡터화합니다.
이러한 임베딩은 RAG가 Snowflake Cortex AI를 통해 대규모 언어 모델에 대한 호출을 보완하여 문서를 컨텍스트로 사용하여 특정 질문에 답하는 데 사용됩니다.
Snowflake 기능인 Streams 및 Task를 사용하여 Snowflake에 추가되는 새 PDF 파일을 자동으로 처리하는 실습까지 진행되었습니다.
실습단계는 아래 과정으로 진행되었습니다.

  • 먼저 몇 개의 문서를 로컬로 가져온 다음 PDF를 보관할 데이터베이스, 해당 PDF를 처리(추출 및 청크)하는 Function 생성, 문서를 업로드할 디렉토리 테이블이 있는 스테이지를 만듭니다.
  • Vector Store 구축 – 각 PDF의 청크와 벡터를 저장할 테이블을 만들고 Snowflake Cortex를 사용하여 텍스트를 임베딩으로 변환하여 저장합니다.
  • 채팅 UI 및 채팅(검색 및 생성) 로직 구축 – Snowflake Streamlit 을 사용하여 간단한 프롬프트 앱을 만듭니다.
Snowflake Cortex를 사용하여 RAG를 성공적으로 수행했으며 통합을 구축하거나 인프라를 관리, 또는 Snowflake 거버넌스 프레임워크 외부로 이동하는 데이터에 대한 보안 문제를 처리할 필요 없이 Snowflake에서 전체 스택 RAG 애플리케이션을 안전하게 구축했습니다.
 
Snowflake 의 Quickstart 에 있는 내용으로 핸즈온랩이 진행되었고, 전체적인 흐름을 파악할 수 있는 좋은 기회가 되었습니다.
 
앞으로 고객분들께 가이드를 드리기 위해서는 각 AI모델의 특성이나 LLM 서비스의 상세한 내용까지 파악이 되어야 할 것으로 생각되며 좀 더 관심있게 살펴볼 예정입니다.

작성 | 전미 매니저 CTC Cloud Solutions Architect 팀
게시물 주소가 복사되었습니다.

이런 콘텐츠도 있어요!

    솔루션

    AI 도입이 많아질수록 왜 더 불안해지는가?_국내 대형 소비재 기업 A사의 6개월 기록

    AI를 전사에 도입하려는 기업이라면 누구나 마주치는 불편한 현실 — 비용은 어디에 쓰이는지 모르겠고, 어떤 데이터가 어디로 나가는지 파악이 안 되고, 부서마다 비슷한 AI 서비스를 따로 만드는 상황 — 을 직접 겪은 한 기업의 이야기입니다. 그리고 그 기업이 어떻게 이 문제를 풀었는지, MegazoneCloud AIR Unit이 어떤 역할을 했는지를 있는 그대로 기록합니다.

    글로벌

    [실무 가이드] 중국 비즈니스의 시작과 끝: ICP 비안, 왜 선택이 아닌 필수인가?

    중국에서 온라인 서비스를 런칭하려는 기업에게 가장 큰 장벽은 기술력이 아니라 ‘행정 절차’입니다. 중국의 거대한 인터넷 생태계에 발을 들이기 위해서는 정부로부터 ‘온라인 신분증’을 발급받아야 합니다. 이 신분증이 바로 ICP(Internet Content Provider) 제도입니다. 단순히 웹사이트를 띄우는 것을 넘어, 차단 없는 안정적인 서비스를 운영하기 위해 실무자가 반드시 알아야 할 핵심 내용을 정리해 드립니다.