[reinvent 2024] 올바른 접근법 찾기: 전통적인 ML과 생성형 AI의 연결

Summary

전통적인 ML과 생성형 AI의 시너지를 탐구하며 적합한 솔루션을 선택하는 기준을 소개합니다. Amazon Bedrock, Amazon Q 같은 로우코드/노코드 도구부터 SageMaker JumpStart 같은 코드 기반 솔루션까지 다양한 AWS 서비스를 활용해 생성형 AI와 ML을 통합하는 방법을 살펴봅니다.


리인벤트 2024 테크 블로그의 더 많은 글이 보고 싶다면?

Tech Blog

AWS re:Invent 2024 Tech Blog written by MegazoneCloud

Overview

  • Title: Finding the right approach: Bridging traditional ML with generative AI [REPEAT]
  • Date: 2024년 12월 2일(월)
  • Venue: Mandalay Bay | Lower Level North | Islander C
  • Speaker:
  • Matthew Purcell(Senior Technical Trainer, Amazon Web Services)
  • Sheetal Jajoo(Sr. Technical Account Manager, Amazon Web Services)
  • Industry: Cross-Industry Solutions

들어가며

이 세션에서는 머신러닝(ML)과 생성형 AI(Generative AI)를 함께 활용하는 하이브리드 접근법에 대해 논의합니다. Traditional ML과 GenAI의 차이점, 활용 시 고려할 점, 그리고 AWS에서 이를 지원하는 서비스들에 대해 정리합니다.

최근 기업들이 데이터 기반 의사결정을 가속화하고, Generative AI와 같은 혁신적인 기술을 채택하면서, Traditional ML과의 결합이 중요한 주제로 떠올랐습니다. Generative AI가 급격히 발전함에 따라, 기존의 전통적 ML 접근법과 Generative AI를 어떻게 효율적으로 통합할 수 있는지가 핵심적인 문제로 대두되었습니다. 이번 세션은 전통적 ML과 Generative AI를 하이브리드 방식으로 결합하여 다양한 비즈니스 문제를 해결하는 방법을 다룬 워크숍 형태로 구성되어 있습니다.

세션에서는 Traditional ML 모델이 Generative AI와 결합될 때 어떻게 더 효율적이고 창의적인 솔루션을 제공할 수 있는지를 실제 사례를 통해 설명했습니다. AWS 서비스인 Amazon SageMaker, Amazon Bedrock, Amazon Textract 등을 활용해 두 기술이 어떻게 통합될 수 있는지에 대한 경험을 쌓을 수 있는시간이었습니다.

Agenda

 Traditional 머신러닝(ML)과 Generative AI의 기본 개념과 차이점을 설명하고, 전통적 머신러닝이 주로 어떤 문제를 해결하는 데 사용되는지, 그리고 GenAI가 이와 어떻게 결합될 수 있는지에 대한 내용을 다룹니다. 또한, 각 기술의 활용 가능성과 적합한 상황에 대해 논의합니다.

Generative AI는 다양한 분야에서 광범위하게 활용되고 있으며, 특히 텍스트 생성, 이미지 생성, 코드 완성, 대화형 인터페이스 등에서 뛰어난 성과를 보여주고 있습니다.

1. 텍스트 생성(Text Generation): 텍스트 생성은 가장 대표적인 활용 분야로, 다양한 콘텐츠를 자동으로 생성하는 데 사용됩니다. 예를 들어, 고객과의 대화에서 빠르게 적절한 응답을 생성할 수 있어, 다양한 비즈니스 상황에서 유용하게 활용됩니다.

2. 이미지 생성(Image Creation): 생성형 AI는 이미지 생성에도 매우 강력한 성능을 발휘합니다. 광고 디자인, 제품 프로토타입 제작, 그리고 예술 작품 창작 등에서 생성형 AI가 중요한 역할을 합니다. 예를 들어, 디자이너가 구체적인 아이디어나 컨셉을 제공하면, AI가 이를 바탕으로 다양한 스타일의 이미지를 생성할 수 있습니다.

3. 코드 완성(Code Completion): 개발자 도구에서 코드 완성 기능은 생성형 AI의 또 다른 중요한 활용 사례입니다. AI는 개발자가 작성하는 코드의 문맥을 이해하고, 자동으로 코드를 제시하거나 오류를 수정해 주는 기능을 제공할 수 있습니다. 이는 개발 속도를 크게 향상시키고, 실수를 줄이는 데 도움을 줍니다.

4. 대화형 인터페이스(Conversational Interfaces): Generative AI는 고객 지원 챗봇이나 대화형 AI 시스템에 활용되어, 사람과의 대화를 자연스럽게 처리할 수 있습니다. 예를 들어, 고객의 문의 사항을 신속하게 해결하거나, 사람처럼 대화하면서 고객 서비스를 개선할 수 있습니다. 이는 비즈니스의 효율성을 높이고, 고객 만족도를 향상시키는 데 중요한 역할을 합니다.

Similarities of Traditional ML / Generative AI

전통적 머신러닝(ML)과 생성형 AI(GenAI)는 둘 다 데이터 기반의 접근 방식을 사용하며, 패턴 학습을 통해 결과를 도출합니다. 즉, 두 기술 모두 데이터를 통해 학습하고, 그 학습된 패턴을 바탕으로 예측을 하거나 새로운 데이터를 생성하는 데 사용됩니다.

  • 데이터 중심: 두 기술 모두 데이터를 통해 학습하고, 예측하거나 생성하는 작업을 수행합니다. 머신러닝 모델은 주어진 데이터에서 예측 모델을 구축하고, 생성형 AI는 데이터를 바탕으로 창의적인 콘텐츠를 생성합니다.
  • 신경망 사용: 전통적인 머신러닝도 신경망 기반의 모델을 활용할 수 있으며, 생성형 AI는 특히 복잡한 신경망을 사용하여 더 큰 규모의 데이터에서 패턴을 학습합니다.
  • 모델 성능 최적화: 두 기술 모두 모델을 학습시킨 후, 성능을 최적화하고 정확도를 높이기 위해 모델 튜닝과 검증이 필요합니다. 이를 통해 더 나은 예측 성능을 끌어낼 수 있습니다.

Differences of Traditional ML / Generative AI

FactorsTraditional MLGenerative AI
Purpose데이터를 바탕으로 예측 수행새로운 콘텐츠 생성
Model Size소규모대규모
Interpretability상대적으로 간단하고 해석이 용이복잡하고 해석이 어려움
UseCase예측 분석, 분류, 회귀 등 다양한 데이터 분석 작업텍스트 생성, 이미지 생성, 코드 완성, 대화형 인터페이스 

Traditional 머신러닝과 Generative AI는 목적, 모델 크기, 해석 가능성 등 여러 면에서 차이를 보이지만, 각 기술이 가진 특성을 잘 이해하고 상황에 맞게 활용하는 것이 중요합니다. 전통적 머신러닝은 예측 및 분석에 적합하고, 생성형 AI는 창의적이고 혁신적인 콘텐츠 생성에 강점을 지니므로, 두 기술은 서로 보완적인 역할을 할 수 있습니다.

Criteria for Selecting the Appropriate Solution

앞에서 확인했듯이 각기 다른 특성과 목적을 가지고 있기 때문에, 사용자가 어떤 기술을 선택할지 결정하기 위한 선택 기준이 중요합니다. 여기에서는 적합한 기술을 선택할 때 고려해야 할 주요 요소는 다음과 같습니다.

FactorsTraditional MLGenerative AI
Problem Domain예측 및 분류 작업
명확한 문제가 있는 경우
구조화된 데이터 분석
자연어 처리 작업
새로운 문서 생성
해결책이나 결과가 명확하게 정의되지 않고, 창의적이고 유연한 사고를 요구하는 작업
Data Characteristics소규모 데이터
구조화된 데이터
대규모 데이터
비구조화된 다양한 데이터
Performance Requirements정확도
속도
확장성
명확한 지표(BLEU for NLP)
InterpretabilityExplainability규정 준수사항
신뢰성
사용자 수용성
Computing / TimeRequirements
추론 속도
하드웨어 사양
개발 속도 및 배포 고려사항

Workshop

이 워크숍은 전통적인 ML과 생성형 AI를 결합하여 고객 지원 시스템을 구축하는 방법을 배우는 기회를 제공하며, AWS의 다양한 AI 서비스를 활용하여 실제 문제를 해결하는 데 중점을 두고 있습니다. 각 단계에서의 실습을 통해 참가자들은 머신러닝 모델의 훈련, 배포 및 평가 과정을 경험하게 됩니다.

목표Tradition ML과 Generative AI를 결합하여 HyBrid 고객 지원 시스템을 구축
Key Config(Traditional)Query Classification by 분류 Model(Traditional ML)- 고객 지원 쿼리를 분류하기 위해 Linear Learner 알고리즘을 사용하여 훈련된 머신러닝 모델을 구축.- CountVectorizer를 통해 텍스트 데이터를 수치 형식으로 변환하여 모델이 이해할 수 있도록 준비.
Key Config(GenAI)Pre-Trained된 언어모델을 통한 응답 생성- 쿼리에 대한 응답을 생성하기 위해 사전 훈련된 언어 모델을 활용.- 전통 ML 모델의 분류 결과를 바탕으로 적절한 시스템 프롬프트를 설정하여 더 자연스러운 응답을 생성.
Key Config(AWS)감정 분석을 위한 AWS AI 서비스 (Amazon Comprehend)- 고객 쿼리의 감정을 분석하여 긍정적, 부정적, 중립적 감정을 식별.- 감정 분석 결과에 따라 쿼리를 인간 상담원에게 에스컬레이션할 필요성을 판단.
Pipeline1. 환경설정 (Lib 설치 / S3 버킷 생성)
2. 데이터 준비 (Train / Test 용으로 분할)3. Traditional ML CountVectorizer를 사용하여 텍스트 데이터를 수치 형식으로 변환.SageMaker의 Linear Learner 알고리즘을 사용하여 모델 훈련.4. 모델 배포 및 추론 (Endpoint  / Prompting)5. Hybrid : 쿼리 분류 (Traditional ML) + 쿼리 응답 생성 (Gen AI)Amazon Comprehend를 사용하여 쿼리의 감정을 분석.6. 검증 (모델의 정확도를 평가하고, 분류 보고서를 생성)

결론

전통적 머신러닝과 생성형 AI는 각기 다른 강점과 특성을 가지고 있기 때문에, 문제의 성격, 데이터의 특성, 모델 해석 가능성, 성능 요구사항, 응용 분야 등을 고려하여 적합한 기술을 선택하는 것이 중요합니다. 선택 기준을 명확히 하고, 각 기술의 특성에 맞게 활용하는 것이 효율적인 결과를 도출할 수 있다는 것을 다시 한번 느꼈으며 신기술을 무작정 적용하는게 아니고 기준을 명확하게 세우고 최적의 선택을 해야겠다 다짐했습니다.
글 │메가존클라우드, AI & Data Analytics Center (ADC), Data Architecture Team, 조민경 매니저
게시물 주소가 복사되었습니다.