[reinvent 2024] prompt engineering 소개
Summary
이 세션에서는 다양한 생성 AI 모델에 대한 프롬프트를 생성하고 최적화하는 방법을 배웁니다. 먼저, 이 세션에서는 대형 언어 모델(LLM)이라는 FM의 하위 집합을 포함한 기초 모델(FM)의 기본 개념을 다룹니다. 그런 다음 프롬프트의 다양한 요소와 프롬프트를 효과적으로 사용하기 위한 몇 가지 일반적인 모범 사례와 같은 프롬프트 엔지니어링의 기본 개념을 다룹니다. 마지막으로, 이 세션에서는 제로 샷, 퓨 샷, 생각의 연쇄 프롬프트 등 기본 프롬프트 기술에 대한 정보를 제공합니다.
리인벤트 2024 테크 블로그의 더 많은 글이 보고 싶다면?
Overview
들어가며
생성형 AI와 기초 모델
생성형 AI는 인간의 두뇌를 모방하는 딥 뉴럴 네트워크를 활용해 복잡한 작업을 처리 한다고 합니다. 특히, 텍스트 요약, 이미지 생성, 챗봇 개발 등에서 효과적으로 활용될 수 있는데 기초 모델은 대규모 데이터 세트를 학습하며, 비지도 학습(Self-supervised learning)을 통해 문맥을 파악 한다고 합니다. 기초 모델의 주요 작업 단계는 Pre-training, Fine-tuning, 그리고 프롬프트 엔지니어링으로 나뉘어 진다네요.
프롬프트 엔지니어링의 핵심 과 설계의 모범 사례
프롬프트 엔지니어링은 입력 데이터를 통해 모델의 출력을 조정하는 기술이라고 합니다. 텍스트-텍스트 모델(대규모 언어 모델)과 텍스트-이미지 모델이 주요 유형이고 프롬프트는 명확하고 간결해야 하며, 명확한 지침과 컨텍스트를 포함해야 한다고 합니다. 예를 들어, 이메일 요약을 요청할 때 요약의 형식, 분량, 대상 정보를 포함시키는 것이 중요하다고 하네요. 효과적인 프롬프트 설계를 위해서는 아래의 세가지 원칙을 지켜주는 것이 중요한거 같습니다.
- 명확하고 간결한 질문 작성
- 원하는 출력 형식 명시
- 필요한 경우 예제 제공
긴 질문보다는 짧고 구체적인 질문으로 나누어야 하며, 필요하면 다양한 모델을 테스트하여 최적의 결과를 도출할 수 있다고 하고 예제 답변을 제공하는 것도 유용하다고 합니다.
Zero-shot 프롬프트 기법
Zero-shot 기법에서는 별도의 예제나 컨텍스트 없이 질문을 통해 답을 도출한다고 합니다. 이 기법은 단순한 작업이나 기본적인 정보 요청에 적합하다고 하네요. 예를 들어, “오늘의 날씨는?“과 같은 단순 질문이 Zero-shot 프롬프트에 해당 할거 같습니다.
Few-shot 프롬프트 기법
Few-shot 기법에서는 예제와 컨텍스트를 제공해 모델의 출력을 예상 가능하게 만드는 기법이라고 합니다. 예를 들어, 특정 문장이 긍정적인지, 부정적인지 판단하는 작업에서 “이 문장은 부정적이다”와 같은 예제를 추가하는 것이라고 합니다. 이를 통해 모델이 작업의 맥락을 더 잘 이해하고 정확도를 높일 수 있을 것 같습니다.
Chain of Thought 프롬프트 기법
Chain of Thought는 복잡한 질문을 다룰 때 유용하다고 합니다. 하나의 질문을 여러 작은 단계로 나누어 작업을 진행하며, 각 단계의 답변을 다음 단계에서 활용한다고 하는데 예를 들어, 자동차 구매 비용 계산에서 “1단계: 차량 가격 계산”, “2단계: 할부 계산”과 같은 방식으로 작업을 나누어 질문하는 기법이라고 합니다.
결론
이번 세션에서는 생성형 AI와 프롬프트 엔지니어링의 개념, 모범 사례, 그리고 다양한 프롬프트 기법을 다룬 세션이었습니다.
대규모 언어 모델은 다양한 산업에서 활용되고 있다는 것은 많은 분들이 이미 알고 있을 것 같습니다. 고객의 질문에 답하는 챗봇, 코드 생성을 돕는 개발 도구(써보니까 정말 좋더군요!), 그리고 마케팅 콘텐츠를 제작하는 창작 도구로 많이 사용되고 있는거 같습니다. 이를 통해 직원 생산성을 높이고 창의적인 작업을 지원할 수 있는 장점이 있는거 같습니다.
명확하고 간결한 질문이 프롬프트의 성공을 좌우하며, 각 기법의 장점을 이해하고 적절히 활용하는 것이 중요하다고 하는데 프롬프트 엔지니어링은 생성형 AI를 효과적으로 활용하는 데 필수적인 기술인것 같다는 생각을 다시 한번 하게되었습니다.