RAG(Retrieval Augmented Generation), 생성형 AI의 한계를 극복하다!
💫간추린 이야기
- 환각효과 멈춰!
- LLM을 구원하러 온 RAG
- RAG를 더 쉽게, Amazon Bedrock!
환각 효과 멈춰!🖐
2024년 가장 주목해야 할 AI 트렌드는 여전히 ‘생성형 AI’입니다. 특히 작년 11월 CahtGPT 가 출시된 이후 LLM(대규모언어모델) 분야의 눈부신 약진이 있었습니다. LLM은 방대한 양의 데이터를 학습하여 인간 수준의 언어 이해 및 텍스트 생성 능력을 갖추었습니다.
그러나 아직 우려의 목소리가 높은 것도 사실인데요, 그 이유는 LLM이 사실이 아니거나 근거가 없는 내용을 생성하기도 하기 때문입니다. 이는 환각 효과(Hallucination)라고 불리는 문제로, 생성형 AI를 상용화하는데 큰 걸림돌로 작용합니다. 비즈니스에서 정보의 정확성은 이루 말할 수 없이 중요하기 때문입니다.
LLM을 구원하러 온 RAG😇

지금 당신이 알아야 할 RAG 기술💻
Vector Database는 앞서 벡터 Embedding Model로 변환한 데이터를 저장하고 검색하는 데이터베이스입니다. RAG는 이 데이터베이스에 저장된 정보를 바탕으로 데이터 간의 유사성을 효율적으로 계산하고 검색하여 LLM이 더욱 정확한 답변을 만들어내도록 돕는 것입니다.

RAG를 더 쉽게, Amazon Bedrock!
그러나 PostgreSQL, OpenSearch 등에서도 Vector Store를 지원하므로 해당 데이터베이스는 서울 리전에서 이용 가능합니다. Amazon bedrock에서 Titan Text Embeddings와 Cohere의 Embed-v3 다국어 모델 또한 공식적으로 한국어를 지원합니다. 따라서 RAG 방식의 구현을 할 때 필요한 임베딩 모델을 손쉽게 Amazon Bedrock의 API 호출로 이용할 수 있습니다.
또한, 다국어 임베딩 모델이 아닌 한국어에 특화된 임베딩 모델 혹은 커스텀한 모델을 사용하는 것도 가능합니다. 이는 AWS 기술 블로그에 생성형 AI를 위한 Amazon SageMaker Endpoint 기반 임베딩 모델 배포에 관련된 자세한 글이 있으니 참고해보시면 좋을 것 같습니다.
마지막으로 RAG에 대해 자세하게 알고싶은 분들을 위해서 좋은 내용을 담고 있는 파이토치 한국 사용자 그룹의 글을 소개해 드립니다.
– 대규모 언어 모델을 위한 검색-증강 생성(RAG) 기술 현황 – 1/2편
– 대규모 언어 모델을 위한 검색-증강 생성(RAG) 기술 현황 – 2/2편
💡 우리 회사의 데이터를 기반으로 한 ‘맞춤형 생성형 AI’, 어떻게 도입할 수 있을까요?
RAG 파이프라인 구성 및 RAG 연계 프롬프트 엔지니어링을 통해 우리 회사에 최적화된 생성형 AI를 구축할 수 있는 ‘GenAI360’에 대해 확인해 보세요.
‘GenAI360’은 기업의 고유한 데이터를 기반으로 즉각적인 생성형 AI 활용이 가능하도록 대상 서비스 선정부터 모델 학습 및 운영 단계까지 지원하는, 메가존클라우드의 오퍼링 서비스입니다.
👉지금 바로 알아보기
글 | 메가존클라우드 마케팅그룹 최은영 매니저