728x90 반응형 언어모델3 [생성형 AI] 프롬프트 엔지니어링 테크닉 프롬프트 엔지니어링 테크닉프롬프트 디자인대화형 생성 AIOpenAI ChatGPTGoogle Bard대규모 언어모델(Large Language Models)언어모델 정렬(Aligning Language Models)언어모델: 학습한 텍스트를 바탕으로 자연스러운 단어를 찾는 모델대부분의 자연어처리 문제들을 언어모델이 학습하는 방식으로 전환 가능대규모 (생성형) 언어모델앞에서부터 한 단어씩 만드는 단방향 언어모델자연스러운 문장을 구사하는 데에 강점대규모 언어모델들은 대부분 생성형 언어모델의 구조언어모델 정렬정렬: 인간의 의도에 부합하는 결과물을 만들어내도록 조정하는 것일반적인 언어모델은 웹 상의 텍스트로 학습자연스러운 대화에 초점이 맞춰져 있지 않음문장을 채우는 것에 주로 초점언어모델(GPT-3) -> 인간.. 2024. 11. 9. [생성형 AI] ChatGPT ChatGPT 개요ChatGPT가 만든 변화Google is done: 영국 일간 인디펜던트가 2022년 12월 올린 기사의 제목일주일 만에 100만, 40일만에 1천만명 돌파두 달 만에 월 사용자 1억명 돌파ChatGPT를 만든 OpenAI테슬라의 일론 머스크, 와이콤비네이터의 샘 알트만, 링크드인의 리드 호프먼 등 IT 업계의 거물들이 힘을 합쳐 만듦2015년 12월에 비영리 기업으로 시작 -> 2019년 MS 투자 영리&비영리 -> 2018년 GPT-1 -> 2019년 GPT-2 -> 2020년 GPT-3ChatGPT란?언어모델(Language Model) GPT: Generative Pre-trained Transformer, 사전 훈련된 생성 변환기검색 엔진: 구글 검색 vs 생성 모델: Cha.. 2024. 10. 14. [생성형 AI] 거대 언어 모델(LLM) [거대 언어 모델(LLM)이란]언어 모델(Language Model, LM)인간의 언어 능력을 모사하는 모델현재 존재하는 문장 내의 단어를 기반으로 앞으로 나올 단어 예측SLM(Statistical Language Model)통계적 언어 모델단어의 등장 횟수를 바탕으로 확률 계산희소성(Sparsity) 문제가 있다 -> 말뭉치 데이터에 없으면 문장 생성이 되지 않음NLM(Neural Language Model)Neural network 기반의 언어 모델Word2Vec, RNN, LSTM, seq2seq 등PLM(Pre-trained Language Model)사전 학습된 언어 모델ELMo, BERT, GPT 등LLM(Large Language Model)PLM의 크기를 훨씬 키운 LMGPT-3, Chat.. 2024. 10. 14. 이전 1 다음 728x90 반응형