ML&DL Research

Big model์ ํ์ฉํ๊ธฐ ์ํด์ ๋น์ ์ด ๊ณ ๋ คํด์ผํ ๊ฒ(fine-tuning, knowledge distillation)
ํด๋น ๊ฒ์๊ธ์ ํํ ๋งํ๋ Big model(GPT-3, BERT)๋ค์ ํ์ฉํ๊ธฐ ์ํด์ ๋ฌด์์ ๊ณ ๋ คํด์ผ ํ ์ง, ํนํ (1) Fine-tuning (2) Knowledge distillation ์ ๋ํ ๋ด์ฉ์ ๋ด๊ณ ์์ต๋๋ค. GPT-3์ ์ ๊ทธ๋ ์ด๋ ๋ฒ์ ์ธ GPT-4๊ฐ ์ต๊ทผ์ ๋ฐํ๋์์ต๋๋ค. ChatGPT๊ฐ ์ฑ๊ณตํ ์์ธ๋ GPT-3๋ผ๋ Big model์ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๊ธฐ ๋๋ฌธ์ด๋ผ๋ ์๊ฐ์ด ๋๋๋ฐ์. ์ด๋ ๋ฏ ๊ธฐํ๊ธ์์ ์ธ ์๋๋ก ๋ฐ์ ํ๊ณ ์๋ pretrained big model๋ค์ ๋ฐ๋ก ์ฌ์ฉํ ์๋ ์๊ฒ ์ง๋ง, ์ค์ ์๋น์ค๋ ์ ์ฉ ๋ถ์ผ์ ์ ํ์ฉํ ์ค ์๋ ๊ฒ์ด ์ค์ํด์ง๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. ์ด ๋ ์ฌ๋ฌ๋ถ๋ค์ด ์์์ผ ํ ๊ฒ๋ค, ํนํ fine-tuning๊ณผ knowledge distillation์ ๋ํด์ ..

ChatGPT๋ฅผ ๊ฐ๋ฅ์ผํ ๊ทผ๋ณธ์ ๋ฌด์์ผ๊น? ChatGPT์๊ฒ ๋ฌผ์ด๋ณด์๋ค.(feat. InstructGPT)
ํด๋น ๊ฒ์๊ธ์ (1) ChatGPT, ๊ทธ๋ฆฌ๊ณ InstructGPT๊ฐ ๊ฐ๋ฅํ๋ ์ค์ ๊ธฐ์ ๊ณผ (2) ํด๋น ๊ธฐ์ ์ด ์ ์ฉ๋ ์๋ฆฌ์ ์์ฌํ๋ ์ ์ ๋ํ ๋ด์ฉ์ ๋ด๊ณ ์์ต๋๋ค. Chapter #1 - ChatGPT๋ฅผ ์ฑ๊ณต์ผ ๋ง๋ ์ค์ ๊ธฐ์ ์ ๋ฌด์์ผ๊น ์ GPT-3๋ ์๋๋ ๊ฑธ ChatGPT๋ ๊ฐ๋ฅํ๊ฒ ๋ ๊ฒ์ธ๊ฐ์? ์ต๊ทผ ํ์ ๊ฐ ๋๊ณ ์๋ chatGPT ChatGPT ๊ฐ ๊ณต๊ฐ๋์ง 2๋ฌ์ด ๋ค ๋์ด๊ฐ๊ณ ์์ต๋๋ค. ChatGPT๋ ์ถ์ 5์ผ๋ง์ ์ฌ์ฉ์ 100๋ง๋ช ์ ๋ฌ์ฑํ๊ณ , ๋๋๋๋ก ์ ํํ ์ธ์ด ๊ตฌ์ฌ๋ฅ๋ ฅ๊ณผ ์ ๋ง ๋์์ด ๋ ๋ฒํ ๋ต๋ณ๋ค์ ๋ณด์ฌ์ฃผ๋ฉด์ ๊ตฌ๊ธ ๊ฒ์์ ๋์ฒดํ ์๋ ์๋ค๋ ์ด์ผ๊ธฐ๊ฐ ๋์ค๋ฉด์ ๋ง์ ํ์ ๋ฅผ ๋ถ๋ฌ์ผ์ผ์ผฐ๋๋ฐ์. ์ต๊ทผ์๋ ์ํ๋ ผ๋ฌธ ์ฌ์ ๊ณต๊ฐ ๋๋ฆฌ์ง ๋ฉ๋์์นด์ด๋ธ(MedRxiv)์ ์ฑ์งํผํฐ๊ฐ ๋ ผ๋ฌธ ๊ณต์ ์๋ก ์ ํ..