[reinvent 2025] Stripe: 에이전트 인프라를 통한 규정 준수 워크플로우 혁신

Summary

전 세계 GDP의 1.38%를 처리하는 Stripe가 금융 범죄 규정 준수(Compliance) 업무의 비효율성을 해결하기 위해 도입한 ‘AI 에이전트’ 구축 사례를 소개합니다. Amazon Bedrock을 기반으로 한 ReAct 에이전트 아키텍처와 전용 인프라 구축 과정, 그리고 이를 통해 리뷰 시간을 26% 단축한 성과를 기술적으로 다룹니다.

리인벤트 2025 테크 블로그의 더 많은 글이 보고 싶다면?

AWS re:Invent 2025 Tech Blog written by MegazoneCloud

Overview

  • Title: Stripe: Revolutionizing compliance workflows with agentic infrastructure
  • Date:  2025년 12월 1일 (월)
  • Venue:  Venetian | Level 3 | Lido 3106
  • Speaker:
  • Hasan Tariq (Principal Solutions Architect, Amazon Web Services)
  • Chrissie Cui (Engineering Manager of Managers, Stripe)
  • Christopher Phillippi (Data Scientist, Stripe)
  • Industry: Financial Services

들어가며

금융 범죄가 고도화되고 규제가 복잡해짐에 따라, 기업들이 규정 준수(Compliance)를 위해 지불해야 하는 비용은 천문학적으로 늘어나고 있습니다. 이번 칼럼에서는 연간 1.4조 달러(약 1,900조 원) 이상의 거래를 처리하며, 이는 전 세계 GDP의 약 1.38%에 달하는 규모이고, 99.999%의 가동 시간을 자랑하는 핀테크 거인 Stripe가, 어떻게 AI Agent를 활용하여 수동 리뷰 프로세스를 혁신하고 운영 효율성을 극대화했는지 세션을 통해 살펴봅니다.

1. 비즈니스 환경과 규정 준수의 비용

Stripe의 비즈니스는 지속적인 성장(Growth), 규정 준수의 규모 확장(Compliance Scale), 그리고 운영 효율성(Operational Excellence)이라는 세 가지 핵심 요인에 의해 형성됩니다. 특히 새로운 시장으로 안전하게 확장하기 위해서는 강력한 컴플라이언스 체계가 필수적입니다.

하지만 금융 규정 준수는 기업에 막대한 리소스를 요구합니다. Forrester의 연구에 따르면 전 세계적으로 금융 범죄 규정 준수에 연간 2,060억 달러가 소요되며, 규제 요구 사항은 매년 35%씩 증가하고 있습니다.

KYC(고객 알기 제도)나 AML(자금 세탁 방지)과 같은 핵심 관행을 통해 금융 생태계를 보호해야 하지만, 이를 수동으로 처리하는 것은 한계에 봉착했습니다.

리뷰어들이 여러 데이터 소스를 수동으로 조사해야 하거나, 관할 구역(Jurisdiction)마다 다른 복잡한 규제를 적용해야 하는 ‘인지 과부하(Cognitive Overload)’ 문제로 인해 리뷰의 일관성이 떨어지고 확장성에 제동이 걸린 것입니다.

2. 해결책: ‘탐정’ 역할을 하는 ReAct 에이전트

Stripe는 이 문제를 해결하기 위해 Amazon Bedrock 기반의 ‘LLM 기반 AI 리서치 에이전트’를 개발했습니다.
  • Front-running Research: 에이전트의 핵심 역할은 인간 리뷰어가 티켓을 열기 전에 미리 조사를 수행하는 것입니다. 마치 룸바 로봇청소기가 외출 중에 집을 청소해 놓는 것처럼, 에이전트는 리뷰어가 출근하기 전에 사건을 조사하고 데이터를 요약해 둡니다.
  • ReAct 패턴과 DAG: 복잡한 리뷰 워크플로우를 한 번에 자동화하는 대신, DAG(Directed Acyclic Graph) 구조를 통해 작업을 ‘한 입 크기(Bite-sized)’로 쪼개어 에이전트가 생각(Thought), 행동(Action), 관찰(Observation)을 반복하는 ReAct 패턴으로 수행하도록 설계했습니다.
  • Human-in-the-Loop: 에이전트는 결정을 내리지 않고 인간을 보조하는 역할에 그칩니다. 모든 결정과 근거는 기록되어 감사(Audit) 가능성을 보장합니다.

3. 인프라 구축: Bedrock 기반의 에이전트 서비스

Stripe 기술팀은 기존 ML 시스템 대신 에이전트 워크로드에 최적화된 새로운 인프라를 구축했습니다.
  • LLM Proxy Service: 여러 팀이 사용하는 LLM 요청을 중앙에서 관리하여 ‘시끄러운 이웃(Noisy Neighbor)’ 문제를 해결하고, 고가용성(High Availability) 및 속도 제한(Quota)을 제어합니다.
  • Amazon Bedrock: 보안 및 표준화된 API를 제공하며, 프롬프트 캐싱(Prompt Caching) 기능을 통해 긴 대화 맥락(Context)을 유지하면서도 비용을 절감할 수 있었습니다. 이는 에이전트가 반복적으로 긴 시스템 프롬프트를 사용할 때 비용 효율성을 크게 높여줍니다.

4. 비즈니스 성과

이 프로젝트의 결과는 놀라웠습니다.
  • 효율성 증대: 에이전트가 사전 조사를 수행함으로써 리뷰어의 평균 처리 시간이 26% 단축되었습니다. (Turbo-charged reviews)
  • 높은 만족도: 현업 리뷰어들은 에이전트의 결과물에 대해 96%의 ‘도움됨(Helpful)’ 평가를 내렸습니다. 이는 시스템에 대한 신뢰가 형성되었음을 의미합니다.
  • 완전한 감사 추적 (Complete Audit Trail): 모든 조치와 결정 근거가 불변의 문서로 기록되어, 규제 기관 조사 시 강력한 증거 자료로 활용할 수 있게 되었습니다.

결론

Stripe의 사례는 생성형 AI가 챗봇을 넘어 실제 비즈니스 프로세스의 핵심 파이프라인으로 들어왔음을 보여줍니다. 특히 “모든 것을 한 번에 자동화하려 하지 말고, 인간을 운전석에 앉히되(Keep Humans in the Driver’s Seat) 에이전트를 도구로 활용하라”는 교훈은 AI 에이전트 도입을 고민하는 모든 기업에 유효한 전략이라는 생각이 들었습니다. Stripe는 앞으로 미세 조정(Fine-tuning)과 강화 학습을 통해 에이전트의 성능을 더욱 고도화할 계획이라고 합니다.
글 │메가존클라우드, Cloud Technology Unit (CTU) AWS Delivery SA 2 팀 서해민 SA

게시물 주소가 복사되었습니다.