gpt-4

Big model์ ํ์ฉํ๊ธฐ ์ํด์ ๋น์ ์ด ๊ณ ๋ คํด์ผํ ๊ฒ(fine-tuning, knowledge distillation)
ํด๋น ๊ฒ์๊ธ์ ํํ ๋งํ๋ Big model(GPT-3, BERT)๋ค์ ํ์ฉํ๊ธฐ ์ํด์ ๋ฌด์์ ๊ณ ๋ คํด์ผ ํ ์ง, ํนํ (1) Fine-tuning (2) Knowledge distillation ์ ๋ํ ๋ด์ฉ์ ๋ด๊ณ ์์ต๋๋ค. GPT-3์ ์ ๊ทธ๋ ์ด๋ ๋ฒ์ ์ธ GPT-4๊ฐ ์ต๊ทผ์ ๋ฐํ๋์์ต๋๋ค. ChatGPT๊ฐ ์ฑ๊ณตํ ์์ธ๋ GPT-3๋ผ๋ Big model์ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๊ธฐ ๋๋ฌธ์ด๋ผ๋ ์๊ฐ์ด ๋๋๋ฐ์. ์ด๋ ๋ฏ ๊ธฐํ๊ธ์์ ์ธ ์๋๋ก ๋ฐ์ ํ๊ณ ์๋ pretrained big model๋ค์ ๋ฐ๋ก ์ฌ์ฉํ ์๋ ์๊ฒ ์ง๋ง, ์ค์ ์๋น์ค๋ ์ ์ฉ ๋ถ์ผ์ ์ ํ์ฉํ ์ค ์๋ ๊ฒ์ด ์ค์ํด์ง๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. ์ด ๋ ์ฌ๋ฌ๋ถ๋ค์ด ์์์ผ ํ ๊ฒ๋ค, ํนํ fine-tuning๊ณผ knowledge distillation์ ๋ํด์ ..