[reinvent 2025] GenAI 스토리보딩: GenAI on AWS를 이용한 스케치에서 3D 장면까지
Summary
이 세션은 아티스트가 창의적 통제력을 유지하면서 Amazon Bedrock의 생성형 AI 기능을 활용하여 초기 스케치를 콘셉트 준비가 완료된 스토리보드로 변환하는 워크플로우를 소개합니다. 통합된 파이프라인을 통해 스케치 구성, 스타일 일관성을 유지하는 2D 에셋 생성, 이미지를 3D 모델로 변환하는 방법을 보여주며, 이는 필름 프리비주얼라이제이션(pre-visualization), 게임 레벨 디자인, UI 프로토타이핑을 위한 빠른 반복을 가능하게 합니다.
리인벤트 2025 테크 블로그의 더 많은 글이 보고 싶다면?
Overview
들어가며

GenAI 스토리보딩의 4단계 워크플로우와 스케치 입력
GenAI 스토리보딩 워크플로우는 스케치 입력 (Sketch Input), 스토리보드 생성 (Storyboard Generation), 3D 장면 (3D Scene), 내보내기 (Export)의 네 단계로 구성되어 있습니다.

1. 스케치 입력 단계는 아티스트가 자신의 비전을 표현하는 가장 중요한 부분입니다. 이는 거친 스케치 또는 초기 구도, 텍스트 설명 (액션이나 스타일 지정), 그리고 참조 이미지 (실제 또는 생성된 이미지)를 포함하며, 이 세 가지 요소를 모두 사용하면 명확한 비전을 전달하는 데 도움이 됩니다.

2. 스토리보드 생성 단계에서는 생성형 AI가 이러한 입력을 받아 반복적인 정제 과정을 거쳐 스케치를 정제된 프레임(polished frames)으로 변환합니다. 이 과정은 이해 단계 (Understanding Phase), 생성 단계 (Generation Phase), 정제 루프 (Refinement Loop)로 나뉘며, 스타일의 일관성 유지, 구도 보존, 그리고 텍스트 기반 편집(Instruction-based editing)이 핵심입니다.

세션에서 소개된 ‘Thermal Pursuit’ 시연 예시를 보면, 스케치에서 시작하여 ‘고대비(High contrast)’, ‘부드러운 질감(Soft texture)’, ‘빛나는 조명(Luminous light)’과 같은 특정 단어를 프롬프트에 사용하여 캐릭터와 장면의 스타일 일관성을 유지하며 이미지를 생성하고 개선했습니다. 특히 Comfy UI와 같은 노드 기반 스토리보드 애플리케이션을 사용하여 각 장면(파란색 상자)의 메타데이터(샷 상세 정보, 카메라 포지션, 액션 등)를 저장하고 반복 작업을 수행하는 예시가 제시되었습니다.

창의적 통제 및 2D/3D 통합

3D 장면 단계는 선택 사항이지만, 시나리오에 복잡한 카메라 움직임이 있거나, 공간적 관계를 이해해야 하거나, 중요한 세트 디자인 레이아웃 문제를 해결해야 할 때 전략적으로 필요합니다. 2D 이미지 에셋을 기반으로 캐릭터 시트를 생성한 후, TRELLIS와 같은 오픈 소스 모델을 사용하여 3D 모델로 쉽게 변환할 수 있으며, 이를 게임 엔진에서 시공간적으로 탐색함으로써 실제 제작 전에 위험을 줄일 수 있습니다.

확장 가능한 AWS 기반 GenAI 파이프라인

3D (Longer Processing) 파이프라인: 3D 변환과 같이 처리 시간이 15분 제한을 초과하는 작업(예: video to 3D는 45분 소요 가능)을 위해서는 큐잉 시스템이 필요합니다. Amazon SQS를 사용하여 작업을 큐에 넣고, 큐에 작업이 있을 때만 Amazon EKS (Elastic Kubernetes Service) 리소스를 필요한 만큼 스핀업/스핀다운하여 비용을 최적화합니다. 이를 통해 GPU가 필요한 장시간의 3D 모델링 작업을 컨테이너 기반으로 안정적으로 처리할 수 있습니다. 이 컨테이너화된 접근 방식은 확장성(scalability)을 높이고, 일관된 환경에서 배포 및 해제를 용이하게 합니다.
결론
GenAI 스토리보딩 워크플로우를 활용함으로써, 품질과 속도라는 트레이드오프 문제를 해결하고, 창의적인 비전과 최종 기술적 실행 사이의 창의적 변환(Creative translation) 거리를 단축시켰습니다. 또한 3D Previsualization과 공간적 검증을 2D 워크플로우의 자연스러운 확장으로 통합하여, 제작 과정에서 문제가 발생하기 전에 위험을 포착하고 줄이는 데 기여합니다. 궁극적으로 이 접근 방식은 아티스트가 AI를 사용하여 창의적 능력을 증폭시키고, 창의적 통제권을 유지하면서 제작 수준의 품질을 앞당기는 결과를 가져옵니다. 비유하자면 전통적인 스토리보딩이 장인이 오랜 시간을 들여 정교하게 돌을 깎는 작업이라면, GenAI 스토리보딩은 아티스트가 디지털 조각 도구를 들고 원하는 형태를 순식간에 구현해내며, 필요한 부분만 즉시 수정하고 3차원 공간에서 미리 볼 수 있는 디지털 공방을 갖추는 것과 같습니다.


