본문 바로가기
IT 공부/생성형 AI

[생성형 AI] 프롬프트 엔지니어링 테크닉

by 해모해모 2024. 11. 9.
728x90
반응형

프롬프트 엔지니어링 테크닉

프롬프트 디자인

  • 대화형 생성 AI

    • OpenAI ChatGPT
    • Google Bard
    • 대규모 언어모델(Large Language Models)
    • 언어모델 정렬(Aligning Language Models)
    • 언어모델: 학습한 텍스트를 바탕으로 자연스러운 단어를 찾는 모델
    • 대부분의 자연어처리 문제들을 언어모델이 학습하는 방식으로 전환 가능
  • 대규모 (생성형) 언어모델

    • 앞에서부터 한 단어씩 만드는 단방향 언어모델
    • 자연스러운 문장을 구사하는 데에 강점
    • 대규모 언어모델들은 대부분 생성형 언어모델의 구조
  • 언어모델 정렬

    • 정렬: 인간의 의도에 부합하는 결과물을 만들어내도록 조정하는 것
      • 일반적인 언어모델은 웹 상의 텍스트로 학습
      • 자연스러운 대화에 초점이 맞춰져 있지 않음
      • 문장을 채우는 것에 주로 초점
    • 언어모델(GPT-3) -> 인간대화학습 -> 인간 피드백 -> 대화형 언어모델(ChatGPT)
      • 인간의 대화와 피드백을 중심으로 인간의 의도에 부합하는 자연스러운 대화 생성을 학습
  • 프롬프팅

    • 언어모델로부터 우리가 원하는 답을 이끌어내는 것
    • 더 좋은 답을 이끌어내도록 프롬프트를 설계하는 것
  • 프롬프트 엔지니어링 기본 원리

    • 효과적인 의사소통 방식 활용
      • 명확성
      • 구체성
      • 다양성
    • 언어모델의 특성 활용
      • 주 언어(영어)
      • 학습 패턴
    • 구체적인 지시사항 추가
    • 모델의 응답 방식(내용, 형식, 말투 등)을 자세하게 명시
    • 인간의 인지 모델링
      • 예시(Few-shot 프롬프팅)
      • 단계적 추론(Chain-of-Thought)
      • 역할 부여(ChatGPT 에이전트)

Few-shot 프롬프팅

  • 문맥 내 학습
    • 언어모델은 주어진 입력에서 패턴을 파악해 알맞은 응답을 만드는 능력이 있음
  • 언어모델의 문맥 내 학습을 이용하여 예시를 통해 원하는 응답을 유도
  • 장점
    • 말로 표현하기 어려운 지시사항을 언어모델이 자동으로 감지하여 따름
    • 예시를 잘 선택하면 성능이 크게 향상
  • 단점
    • 입력의 길이가 크게 증가함
    • 잘못된 패턴을 이용하거나 예시를 과하게 따라하여 성능이 하락할 수 있음
    • 선택된 예시에 매우 민감
  • 다양한 주제의 예시를 포함
  • 엣지 케이스에 대한 예시 포함
  • 구분자 사용
  • 예시의 개수: 많을수록 좋음
  • 모델의 입력 길이 제한, 비용 문제를 고려하여 최대한 많은 예시를 사용
  • 많은 예시를 준비한 뒤, 몇 개를 선택해서 사용 가능

Chain-of-Thought

  • 프롬프팅을 활용한 추론문제 해결

    • 언어모델의 약점: 복잡한 추론에 대한 한계
    • 복잡한 추론: 신뢰할 수 있는 합리적 의사결정에 필수
    • 복잡한 추론의 요소 [Kahneman's Systems of Thinking]
      • 워킹 메모리: 언어모델에 중간 과정에 대한 기억 제공
      • 멘탈 시뮬레이션
      • 순차적 의사결정: 결과에 도달하기까지 순차적으로 판단
      • 천천히 심사숙고
    • Chain-of-Thought: 풀이과정을 쓰면서 차근차근 문제를 해결하는 프롬프팅 방식
  • 제로샷 Chain-of-Thought

    • Chain-of-Thought는 많은 수의 고품질 예제를 준비학 어려움
    • 트리거 프롬프트(차근차근 생각)로 중간과정을 자세히 서술하도록 유도
  • Chain-of-Thought 고도화

    • 더 정교한 추론 구조 설계

ChatGPT 에이전트

  • 에이전트 언어모델

    • 언어모델에 신념, 욕구, 의도 부여
    • 이를 기반으로 행동, 관찰, 사고, 판단
    • 문제 -> 작업계획 -> 도구활용(계산기, 언어모델, 검색엔진, 시각모델)
  • ReAct: 사고하고 행동하는 언어모델

  • AgentGPT: 자동 AI 에이전트

  • 공개된 ChatGPT 에이전트 시스템

    • AutoGPT, BabyAGI, JARVIS, HuggingGPT
      • ChatGPT를 이용하여 주어진 문제 해결
      • 보조자료를 통해 시연 영상 확인
728x90
반응형

댓글