AI 업계에 큰 돌풍을 일으키고 있는 ChatGPT도 처음부터 놀라운 성능을 가졌던 것은 아닙니다. 이번 글에서는 Open AI의 ChatGPT 초기 버전인 GPT-1부터 가장 최신 버전인 GPT-4까지 정보를 정리했습니다. 그리고 중요한 RLHF 학습법도 간단하게 알아보겠습니다.
글의 순서는 다음과 같습니다.
- Open AI의 GPT 시리즈(버전) 정리 및 비교
- RLHF : Open AI의 GPT가 ChatGPT가 된 학습 방법
Open AI의 GPT 시리즈(버전) 정리 및 비교
GPT-1
- 출시 년월 : 2018년 6월
- 파라미터 수(개) : 1억 1천7백만
- 특징
1. 주요 학습 데이터 : BookCrawl
2. 학습 방식 : Unsupervised Pre-training with Unlabeled data and Supervised fine-tuning with labeleddata
3. 특정 Task를 위해 매번 Fine-tuning이 필요하며, 학습 데이터에 민감
GPT-2
- 출시 년월 : 2019년 2월
- 파라미터 수(개) : 15억 4천2백만
- 특징
1. 주요 학습 데이터 : WebText(800만 개의 문서, 40GB 용량)
2. 학습 방식 : Unsupervised Pre-training and Zero shot Learning
3. 메타 러닝(Meta learning)의 일종인 In-context-learning(사전학습 모델 Task에 대한 텍스트 인풋을 삽입)
GPT-3
- 출시 년월 : 2020년 6월
- 파라미터 수(개) : 1,750억
- 특징
1. 주요 학습 데이터 : CommonCrawl(Web, e-book, wiki 등 753.4 GB)
2. 학습 방식 : Unsupervised Pre-training andZero shot, One shot, Few shot Learning
3. 사람처럼 글 쓰기, 코딩, 번역, 요약 가능
4. 예시를 통해 간접적으로 모델에 지시
GPT-3.5 (ChatGPT)
- 출시 년월 : 2022년 11월
- 파라미터 수(개) : 1,750억
- 특징
1. 주요 학습 데이터 : CommonCrawl(Web, e-book, wiki 등 753.4 GB)
2. 학습 방식 : 인간 피드백 기반 강화학습( RLHF) 적용으로 답변 정확도와 안정성 급증
3. GPT-3과 달리 직접적으로 대화 형태로 지시
GPT-4
- 출시 년월 : 2023년 3월
- 파라미터 수(개) : 비공개
- 특징
1. 모델 구조/크기, 하드웨어 정보, 데이터 및 모델 학습 방법 비공개
2. 이미지 입력도 받을 수 있는 멀티모달(Multimodal) 기능 탑재
RLHF : Open AI의 GPT가 ChatGPT가 된 학습 방법
GPT의 성능은 버전이 업그레이드될수록 더욱 향상되었고, GPT-3 버전부터 인간에 가까운 언어 구사능력을 보여준다는 평가를 받게 되었습니다. 특히 사람과 대화하는 것처럼 느껴지는 GPT-3.5 버전에는 RLHF를 적용했습니다.
RLHF는 Reinforcement Learning with Human Feedback의 약자로 인간 피드백 기반 강화학습입니다. 즉, GPT 학습에 사람이 직접 개입한 학습법입니다. RLHF에 대해서 조금 더 자세하게 설명해 보겠습니다.
RLHF는 인간이 작성한 질문과 답변으로 학습시킨 다음, 모델(AI)이 주어진 질문에 대해 답변을 여러 개 생성하면 인간이 순위를 매겨서 추가 학습을 시킵니다.
그러면 모델(AI)은 인간이 더 높은 점수를 매긴 답변을 내놓는 방향으로 학습이 됩니다. 즉, 사용자의 의도와 니즈에 부합하는 답변을 생성할 수 있도록 강화 학습 되는 것입니다.
이렇게 GPT-3.5는 RLHF를 통해 최종적으로 생성되는 답변의 성능을 높였습니다. 그리고 이런 성능을 갖춘 GPT-3.5를 기반으로 대화형으로 개발된 서비스가 ChatGPT입니다.
'IT' 카테고리의 다른 글
비전공자를 위한 프로그래밍 언어, 컴파일러, IDE 쉽게 이해하기 (0) | 2023.04.12 |
---|---|
비전공자를 위한 쉬운 IT 지식 1편 : 커뮤니케이션을 위한 IT 지식과 필요성 (0) | 2023.04.08 |
ChatGPT가 쏘아 올린 생성형 AI 경쟁과 발전의 부작용과 한계 (0) | 2023.03.10 |
ChatGPT(Microsoft) vs Bard(Google), 글로벌 AI 경쟁 현황 쉽게 보기 (0) | 2023.03.08 |
비전공자를 위한 ChatGPT의 생성형 AI(Generative AI) 쉽게 알아보기 (0) | 2023.03.07 |
댓글