[메클 인사이트] AI가 어려워? 데이터도 어려워? 일단 데이터 파운데이션(Data Foundation)부터 시작🎲
동영상 타임라인
00:20 나야 TechExam
00:54 🧑🏻💻데이터 엔지니어 등장
02:22 🧑🏻💻데이터 엔지니어(Data Engineer)가 뭐길래?
05:20 🤖스마트폰 날씨 췍! 알고보면 #AI #ML #LLM #RNN #데이터
07:20 🤖영어 공부 어플 #챗봇 #GenAI
08:10 🤖보험 약관 #검색 #RAG #GenAI
11:02 📊보고서 지옥 탈출! 데이터 파운데이션
12:46 📊고객 사례: 도입 배경 & 도입 성과 15:45 🗝️SaaS가 뭐길래?
18:05 🗝️스노우플레이크 & 트로코(Snowflake & trocco)
19:16 ⚡메가존클라우드 데이터팀: 멋지다! 대단해! 엄청나!
20:31 ⚡DataLab Service: 데이터 엑셀러레이터 프로그램
들어가며
생성형 AI(Gen AI 또는 Generative AI)는 방대한 데이터를 딥러닝(Deep Learning)을 통해 사전 학습을 시킴으로서 데이터 간의 연관도를 분석하고 이를 바탕으로 ‘문서, 이미지, 동영상’ 등 결과물로 산출하는 것입니다. 사실 이것도 데이터 기반 접근이 있었기에 가능한 기술이죠. 조금 더 자세히 설명하자면, RNN(Recurrent Neural Network)이라는 순환신경망 구조에 대한 이해가 필요합니다. 해당 딥러닝(Deep Learning) 아키텍처는 인간의 두뇌를 본떠 만든 계층 구조로서 뉴런과 같은 연결 노드를 사용하여 컴퓨터를 가르칠 수 있습니다. 이와 같은 학습을 통해서 컴퓨터는 규칙적인 신호 처리 분석 및 자연어 처리, 이미지 분석, 음성 인식 문제를 해결하는데 효과적입니다. 생성형 AI 는 방금 말씀드린 RNN 보다 진보된 트랜스포머 모델(Transformer Model)이라는 신경망 아키텍처를 사용합니다. 이 모델을 사용함으로써 병렬 처리가 어려워 학습 속도가 느렸던 RNN 의 한계를 극복하고 자연어 처리 분야에 상당한 수준의 성과를 거둘 수 있었습니다. 이런 기술이 적용한 유명한 서비스가 바로 ChatGPT 입니다. 이외에도 텍스트로 이미지를 생성할 수 있는 Stable Diffusion과 같은 생성형AI 도 있지요.

오늘의 테크 전문가 소개
- 성함: 최경진
- 소속/직함: 메가존클라우드 Cloud Tech Center(CTC) 팀장
- 특징
- 대한민국 1호 Snowflake Data Superhero
- 데이터 엔지니어 전문가
- 메가존클라우드 AWS SA(Solutions Architect) 및 Snowflake 담당






CTC 소속 데이터팀은 어떤 업무를 할까?
‘데이터 엔지니어’는 개발자와 무엇이 다를까요?
‘데이터 엔지니어’의 필수 역량과 업무 소개
1. 클라우드 인프라 구축 역량
2. ETL 또는 ELT 작업 등 개발자 역량
3. 데이터 분석가 역량
데이터는 데이터 엔지니어 같은 전문가들만 다를 수 있는 것일까요?
혹시 “시리야~”, “오케이 구글”, “헤이 빅스비” 등 휴대폰을 통해 가상 비서를 찾아보신 적 있으신가요? 사실 여기에는 AI/ML 기술 중 “음성인식 및 자연어 처리” 기술과 앞서 소개 드린 트랜스포머 모델(Transformer Model)이라는 신경망 아키텍처가 적용된 기술입니다. 이렇게 기술적으로 파고들면 복잡하지만, 사실 우리가 일상에서는 편하게 사용하고 있는 기술이죠. 우리의 일상에서 생성형 AI 기술이 적용된 또 다른 사례를 소개해볼게요.
우리의 일상생활 속 데이터 기술? 챗봇(Chatbot)!
우리의 일상생활 속 데이터 기술? 보험약관 AI 검색! #RAG
왜 우리는 데이터 활용을 어렵게 느끼는 걸까?
왜 업무에서는 데이터 활용을 어렵게 느끼고 있을까요?”
데이터 파운데이션(Data Foundation)
엔터프라이즈 데이터(Enterprise Data)로 활용하기 위한 토대를 마련할 수 있도록 수행하는
기본 인프라, 프로세스 및 전략 활동을 의미합니다.
데이터 파운데이션 도입 전, 의미 있는 성과를 위해 고려해야 할 것
- 내가 가지고 있는 데이터가 무엇이 있을까?
- 내가 필요로 하는 데이터가 어디에 있을까?
- 내가 가지고 있는 데이터로 무엇을 할 수 있을까?
‘데이터 파운데이션’ 적용한 고객사례
The Challenge
- 해당 기업은 글로벌 기업으로 해외에 본사가 있고,
- 한국 소속 담당자 단 한 명이 글로벌 향으로 매달 판매 리포트 발간 업무를 담당하고 있었습니다.
- 자사의 매월 판매 수치와 여러 경쟁사의 판매 수치 등 데이터를 모두 엑셀로 취합 후
- 도표와 차트 등 데이터 시각화(Data Visualization) 작업하여 리포트를 작성
- 이를 매월 전 세계 지사로 리포트 발행했습니다.
AS IS(Pain Points)
- 실무자는 월간 2회의 보고서를 수기로 매번 작성을 해야 하는 데,
실문자가 휴가를 가거나 일이 생겨도 이것을 대체할 수 있는 사람이 마땅히 없었습니다. - 전 세계 여러 지사에서 매달 리포트를 기다리고 있는데, 이분이 개인 사정으로 그 업무를 하지 못하면 당월의 ‘한국 지사의 판매 리포트’는 지연이 되는 거지요. (업무 지연)
- 여기서 또 다른 페인 포인트는 보고서를 매월 2번 작성해야한다고 말씀드렸잖아요?
- 첫 번째 보고서는 ‘자사의 판매 데이터’와 ‘경쟁사들의 판매 예상 데이터’를 임의로 넣어서 리포트를 발행하고
- 두 번째 보고서는 그 사이에 구매한 ‘경쟁사들의 실제 판매 데이터’를 넣어서 최종 리포트를 발간합니다.
- 똑같은 양식의 리포트이지만, 실제 데이터를 돈 주고 사오는 기간동안에도 참고할 리포트가 있어야 하기에 , 똑같은 작업을 두번 씩 수기로 해야하는 겁니다.
- 담당자의 업무 부담이 클 수 밖에 없었죠.
TO BE(Outcomes)
- [대시보드 구축] 매달 한국 지사의 판매 실적과 경쟁사와 판매 실적을 비교할 수 있는 대시보드를 구축
- [반복 업무 최소화] 월 최소 2회 이상 씩 리포트를 수기로 작성 업무 생략
- [리포트 자동 생성] 단순히 매출 데이터 파일을 클라우드에 업로드 하는 것 만으로 기존과 유사한 템플릿의 리포트를 자동 생성
- [업무 시간 단축] 이를 통해서 실무자는 데이터 검수 작업만 수행하게 됨으로서 혁신적으로 업무 시간 단축
- [효율적인 업무 협업] 리포트 작업에 익숙지 않은 인력(인턴 등)도 리포트를 다운로드 할 수 있게 되어서 , 단순 수작업 업무 배분 및 협업 가능
- 여기서, 주목할 부분은 “실무자”가 데이터 비전문가라는 부분입니다.
데이터 비전문가를 위한 솔루션 SaaS(Software as a Service)
클라우드 컴퓨팅(Cloud Computing) 3가지
IaaS
PaaS
SaaS
SaaS는 어떤 장점이 있을까요?
① 용이한 확장성
② 사용 편의성
③ 실시간 개선
스노우플레이크(Snowflake)
뿐만 아니라 하나의 플랫폼에서 애플리케이션을 개발하여 서비스를 제공할 수 있고, 요즘 가장 핫한 LLM(Long Language Model) 기능을 포함한 ML(Machine Learning) 기능도 제공하고 있어서 ML(Machine Learning)에 대한 개념이 부족해도 나만의 ML 서비스를 만들어볼 수 있습니다.
트로코(trocco)
메가존클라우드의 역할과 강점
- 고객의 문제를 정확하게 진단하고, 필요한 솔루션을 제안해드릴 수 있습니다.
- 물론 고객사에 적합한 데이터 기반 인프라를 구축해드릴 수도 있습니다.
- 메가존클라우드는 매우 다양한 메이저 파트너사와 함께하고 있습니다.
- 따라서 수 많은 솔루션 중 고객에게 적합한 솔루션을 찾아서 제안드릴 수 있습니다.
마무리하며
🍪DataLab Service(데이터랩)에 대해 궁금하신가요?
– 전문지식을 갖춘 데이터 엔지니어가 A부터 Z까지 함께 하는 여정
– 종합 지원 아키텍처 지침과 모범 사례와 데이터 분석 프로젝트 경험 보유
– 최적의 결과를 위해 AWS 데이터베이스, 분석, AI/ML, 서버리스 서비스 활용
📬데이터랩(DataLab Service) 서비스를 받아보고 싶다면? 온라인 상담신청
#SaaS #SoftwareasaService #AI #GenAI #생성형AI #데이터 #Data #데이터파운데이션 #DataFoundation #메가존 #메가존클라우드 #Megazone #MegazoneCloud

