[reinvent 2025] GenAI 스토리보딩: GenAI on AWS를 이용한 스케치에서 3D 장면까지

Summary

이 세션은 아티스트가 창의적 통제력을 유지하면서 Amazon Bedrock의 생성형 AI 기능을 활용하여 초기 스케치를 콘셉트 준비가 완료된 스토리보드로 변환하는 워크플로우를 소개합니다. 통합된 파이프라인을 통해 스케치 구성, 스타일 일관성을 유지하는 2D 에셋 생성, 이미지를 3D 모델로 변환하는 방법을 보여주며, 이는 필름 프리비주얼라이제이션(pre-visualization), 게임 레벨 디자인, UI 프로토타이핑을 위한 빠른 반복을 가능하게 합니다.

리인벤트 2025 테크 블로그의 더 많은 글이 보고 싶다면?

AWS re:Invent 2025 Tech Blog written by MegazoneCloud

Overview

  • Title: GenAI Storyboarding: From Sketch to 3D Scene with GenAI on AWS
  • Date: 2025년 12월 4일 (목)
  • Venue: Mandalay Bay | Level 3 South | South Seas A
  • Speaker:
  • Eric Cornwell (Sr. Spatial Computing Solution Architect, AWS)
  • Stanford Lee (Technical Account Manager, AWS)
  • Industry: Games, Media & Entertainment, Software and Internet)

들어가며

기존 스토리보딩 과정은 창의적인 비전을 시각적으로 정확하게 표현하는 데 상당한 시간 투자가 필요하며, 신속한 제작(속도)과 품질 사이에서 항상 트레이드오프(tradeoff)가 발생합니다. 또한, 창의적인 개념을 기술적 실행으로 옮기는 과정에서 어려움이 있으며, 2D 결과물만으로는 3D 공간, 조명, 크기 등의 핵심적인 질문에 답할 수 없는 2D-3D 검증 격차(validation gap)가 존재했습니다. 이번 칼럼에서는 이러한 전통적인 병목 현상을 해결하고, 아티스트가 창의적 통제권을 유지하면서도 워크플로우를 가속화할 수 있는 아티스트 중심의 생성형 AI(GenAI) 스토리보딩 접근 방식에 대해 자세히 공유하겠습니다.

GenAI 스토리보딩의 4단계 워크플로우와 스케치 입력

GenAI 스토리보딩 워크플로우는 스케치 입력 (Sketch Input), 스토리보드 생성 (Storyboard Generation), 3D 장면 (3D Scene), 내보내기 (Export)의 네 단계로 구성되어 있습니다.

1. 스케치 입력 단계는 아티스트가 자신의 비전을 표현하는 가장 중요한 부분입니다. 이는 거친 스케치 또는 초기 구도, 텍스트 설명 (액션이나 스타일 지정), 그리고 참조 이미지 (실제 또는 생성된 이미지)를 포함하며, 이 세 가지 요소를 모두 사용하면 명확한 비전을 전달하는 데 도움이 됩니다.

2. 스토리보드 생성 단계에서는 생성형 AI가 이러한 입력을 받아 반복적인 정제 과정을 거쳐 스케치를 정제된 프레임(polished frames)으로 변환합니다. 이 과정은 이해 단계 (Understanding Phase), 생성 단계 (Generation Phase), 정제 루프 (Refinement Loop)로 나뉘며, 스타일의 일관성 유지, 구도 보존, 그리고 텍스트 기반 편집(Instruction-based editing)이 핵심입니다.

세션에서 소개된 ‘Thermal Pursuit’ 시연 예시를 보면, 스케치에서 시작하여 ‘고대비(High contrast)’, ‘부드러운 질감(Soft texture)’, ‘빛나는 조명(Luminous light)’과 같은 특정 단어를 프롬프트에 사용하여 캐릭터와 장면의 스타일 일관성을 유지하며 이미지를 생성하고 개선했습니다. 특히 Comfy UI와 같은 노드 기반 스토리보드 애플리케이션을 사용하여 각 장면(파란색 상자)의 메타데이터(샷 상세 정보, 카메라 포지션, 액션 등)를 저장하고 반복 작업을 수행하는 예시가 제시되었습니다.

창의적 통제 및 2D/3D 통합

GenAI 접근 방식은 기존의 비싸고, 느리고, 제한적인 ‘생성-대기-검토-재시작’ 방식의 전통적인 반복 주기 대신, 빠르고, 저렴하며, 무제한적인 ‘생성-검토-편집-검토-편집’의 반복 주기를 가능하게 하여 창의적인 탐색과 빠른 문제 해결을 지원합니다. 이로써 아티스트는 AI의 결과물을 통제하고(you are in control of the AI), 원하는 바를 반복적으로 정제할 수 있습니다.

3D 장면 단계는 선택 사항이지만, 시나리오에 복잡한 카메라 움직임이 있거나, 공간적 관계를 이해해야 하거나, 중요한 세트 디자인 레이아웃 문제를 해결해야 할 때 전략적으로 필요합니다. 2D 이미지 에셋을 기반으로 캐릭터 시트를 생성한 후, TRELLIS와 같은 오픈 소스 모델을 사용하여 3D 모델로 쉽게 변환할 수 있으며, 이를 게임 엔진에서 시공간적으로 탐색함으로써 실제 제작 전에 위험을 줄일 수 있습니다.

확장 가능한 AWS 기반 GenAI 파이프라인

이 GenAI 스토리보딩 워크플로우는 AWS 서비스 위에서 확장 가능하도록 구축되었습니다.
2D (Text-to-Image) 파이프라인: 사용자는 웹 앱(AWS Amplify로 호스팅)을 통해 스케치, 텍스트 등을 AWS 환경으로 전송합니다. Amazon API Gateway는 요청을 백엔드로 라우팅하며, AWS Lambda는 텍스트를 이미지로 변환하는 생성형 AI API 호출을 처리합니다 (이 경우 Amazon Bedrock 또는 오픈 소스 모델 사용 가능). 생성된 이미지 에셋은 Amazon S3에 저장되고, 관련 메타데이터(프롬프트 정보 포함)는 Amazon DynamoDB에 저장되어 다음 반복 개발에 활용됩니다.


3D (Longer Processing) 파이프라인: 3D 변환과 같이 처리 시간이 15분 제한을 초과하는 작업(예: video to 3D는 45분 소요 가능)을 위해서는 큐잉 시스템이 필요합니다. Amazon SQS를 사용하여 작업을 큐에 넣고, 큐에 작업이 있을 때만 Amazon EKS (Elastic Kubernetes Service) 리소스를 필요한 만큼 스핀업/스핀다운하여 비용을 최적화합니다. 이를 통해 GPU가 필요한 장시간의 3D 모델링 작업을 컨테이너 기반으로 안정적으로 처리할 수 있습니다. 이 컨테이너화된 접근 방식은 확장성(scalability)을 높이고, 일관된 환경에서 배포 및 해제를 용이하게 합니다.

결론

GenAI 스토리보딩 워크플로우를 활용함으로써, 품질과 속도라는 트레이드오프 문제를 해결하고, 창의적인 비전과 최종 기술적 실행 사이의 창의적 변환(Creative translation) 거리를 단축시켰습니다. 또한 3D Previsualization과 공간적 검증을 2D 워크플로우의 자연스러운 확장으로 통합하여, 제작 과정에서 문제가 발생하기 전에 위험을 포착하고 줄이는 데 기여합니다. 궁극적으로 이 접근 방식은 아티스트가 AI를 사용하여 창의적 능력을 증폭시키고, 창의적 통제권을 유지하면서 제작 수준의 품질을 앞당기는 결과를 가져옵니다. 비유하자면 전통적인 스토리보딩이 장인이 오랜 시간을 들여 정교하게 돌을 깎는 작업이라면, GenAI 스토리보딩은 아티스트가 디지털 조각 도구를 들고 원하는 형태를 순식간에 구현해내며, 필요한 부분만 즉시 수정하고 3차원 공간에서 미리 볼 수 있는 디지털 공방을 갖추는 것과 같습니다.

글 │메가존클라우드, CTU, CoE Team, 김보근 매니저

게시물 주소가 복사되었습니다.