[Tech Blog] AWS로 구현한 AI 챗봇 상담비서 PoC 사례와 실전 구축 팁
들어가며
아키텍처 및 AWS 서비스 주요 구성

- Amazon Simple Storage Service (S3): 지식 베이스 역할을 할 원본 데이터 및 이미지 파일 등을 저장하여 전처리에 필요한 데이터를 구성합니다.
- Amazon Elastic Compute Cloud (EC2): 웹 서버 및 API 연동 인터페이스 역할을 수행하는 컴퓨팅 리소스입니다. 본 환경은 테스트 용도로 구성되므로 PoC 단계에서는 고사양의 인스턴스가 꼭 필요한 것은 아닙니다. 다만, OpenSearch 및 Amazon Bedrock과의 연동 시 API 호출과 응답 속도에 영향을 줄 수 있으므로, 인스턴스의 I/O 성능은 확인하는 것이 좋습니다.
- Amazon OpenSearch Service: 챗봇 구현에 필요한 벡터 데이터베이스 저장소로 사용됩니다. 벡터 데이터베이스는 AI가 이해할 수 있도록 정보를 숫자로 바꿔 저장하고, 비슷한 내용을 빠르게 찾아주는 데이터베이스 형태를 말합니다. PoC의 경우 일반적으로 데이터 양이 크지 않으므로 초기에는 작은 사이즈나 서버리스로도 구성 가능합니다. OpenSearch는 엔드포인트 기반으로 접속할 수 있습니다. 보안을 고려하여 공인으로 접속하기보다 VPC 내 사설 망에서 사용하는 것을 권장합니다.
- Amazon Bedrock은 AI 챗봇에 활용되는 대규모 언어 모델(LLM)을 제공합니다. 대규모 언어 모델은 방대한 텍스트 데이터를 학습하여 사람처럼 자연스러운 언어를 이해하고 생성하는 인공지능 기술입니다. Amazon Bedrock에서 제공하는 기반 모델(Foundation Model)은 리전별로 다르며, 본 PoC에서는 고객사가 이미 리소스를 보유하고 있는 동일 리전 내에서 Bedrock을 구성하였습니다.
Amazon Bedrock에서 접근 가능한 기반 모델은 모델 별로 다른 특성을 가지고 있습니다. 예를 들어, Anthropic의 Claude 모델은 텍스트 기반 질의응답과 요약에 적합하고, Stability AI의 Stable Diffusion 모델은 이미지 생성에 특화되어 있어, 사용 목적에 맞는 모델 선택이 중요합니다.
이번 PoC에서는 일반적으로 많이 사용되는 Claude Sonnet 엔진을 활용해 사용자 질문에 대한 응답을 생성하고, 데이터 임베딩 작업에는 AWS의 Titan Embeddings 모델을 사용합니다. Bedrock의 기반 모델을 활용하려면, 다음과 같이 사전에 모델 활성화가 필요합니다.
Amazon Bedrock → Bedrock Configurations → Model Access → Enable Specific Models |
이 외에도 API 구현 방식에 따라 AWS Lambda를 사용할 수 있으며, 애플리케이션 서버의 패키지 다운로드, API 호출 등의 외부 통신을 위해서 NAT Gateway가 필요합니다. PoC 환경에서는 기능검증이 우선 순위라 판단하기에 일반적으로 공인 IP로 접속 가능하게 설정하기도 합니다. 도메인 연결이 필요하다면 AWS Route 53 등 네임 서버 서비스를 이용할 수 있습니다. 마지막으로 챗봇 대화 기록을 저장하고 히스토리를 불러오기위해서는 DynamoDB 에 적재 가능합니다.
AI 챗봇 구성 시 고려사항과 실전 구축팁
또한, 챗봇 API에 대한 접근은 허용된 IP 대역(Whitelist)으로 제한하여 외부 접근을 제어할 수 있습니다. 예를 들어, Security Group설정을 통해 API Gateway나 Load Balancer 앞단에서 특정 사설망의 IP 요청만 허용하면, 불필요한 외부 트래픽을 효과적으로 차단할 수 있습니다.
챗봇이 AWS 외부 시스템이나 타 AWS 계정의 리소스와 통신해야 하는 경우에는 VPC Peering, AWS PrivateLink, Transit Gateway와 같은 네트워크 연결 옵션을 고려할 수 있습니다. 또한 API 키 기반 인증을 통해 민감 데이터에 대한 접근 권한을 관리할 수 있습니다. 이와 같이 챗봇을 구성할 때는 단순한 기능 구현을 넘어, 네트워크 아키텍처와 인증 체계까지 포함하여 보안을 전반적으로 고려하는것이 필요합니다.
PoC를 위한 데이터셋을 구성 할때에는 실제 사용자 정보를 포함하지 않고, PII(Personal Identifiable Information), PHI(Protected Health Information) 등 개인정보를 포함하지 않도록 주의가 필요합니다. PoC 이후 시스템을 실제로 운영하게 된다면 사전에 데이터 보안 및 개인정보 규정 준수 여부를 확인해야합니다.


마무리하며
- 메가존클라우드, Cloud Tech Unit, AWS Account SA 최진문 리더
- 메가존클라우드, Cloud Tech Unit, AWS Delivery SA 김지희 매니저