ML&DL Research

    Big model์„ ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋‹น์‹ ์ด ๊ณ ๋ คํ•ด์•ผํ•  ๊ฒƒ(fine-tuning, knowledge distillation)

    ํ•ด๋‹น ๊ฒŒ์‹œ๊ธ€์€ ํ”ํžˆ ๋งํ•˜๋Š” Big model(GPT-3, BERT)๋“ค์„ ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋ฌด์—‡์„ ๊ณ ๋ คํ•ด์•ผ ํ• ์ง€, ํŠนํžˆ (1) Fine-tuning (2) Knowledge distillation ์— ๋Œ€ํ•œ ๋‚ด์šฉ์„ ๋‹ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. GPT-3์˜ ์—…๊ทธ๋ ˆ์ด๋“œ ๋ฒ„์ „์ธ GPT-4๊ฐ€ ์ตœ๊ทผ์— ๋ฐœํ‘œ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ChatGPT๊ฐ€ ์„ฑ๊ณตํ•œ ์›์ธ๋„ GPT-3๋ผ๋Š” Big model์„ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๋Š” ์ƒ๊ฐ์ด ๋“œ๋Š”๋ฐ์š”. ์ด๋ ‡๋“ฏ ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์ธ ์†๋„๋กœ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ๋Š” pretrained big model๋“ค์„ ๋ฐ”๋กœ ์‚ฌ์šฉํ•  ์ˆ˜๋„ ์žˆ๊ฒ ์ง€๋งŒ, ์‹ค์ œ ์„œ๋น„์Šค๋‚˜ ์ ์šฉ ๋ถ„์•ผ์— ์ž˜ ํ™œ์šฉํ•  ์ค„ ์•„๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ด์ง„๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋•Œ ์—ฌ๋Ÿฌ๋ถ„๋“ค์ด ์•Œ์•„์•ผ ํ•  ๊ฒƒ๋“ค, ํŠนํžˆ fine-tuning๊ณผ knowledge distillation์— ๋Œ€ํ•ด์„œ ..

    ChatGPT๋ฅผ ๊ฐ€๋Šฅ์ผ€ํ•œ ๊ทผ๋ณธ์€ ๋ฌด์—‡์ผ๊นŒ? ChatGPT์—๊ฒŒ ๋ฌผ์–ด๋ณด์•˜๋‹ค.(feat. InstructGPT)

    ํ•ด๋‹น ๊ฒŒ์‹œ๊ธ€์€ (1) ChatGPT, ๊ทธ๋ฆฌ๊ณ  InstructGPT๊ฐ€ ๊ฐ€๋Šฅํ–ˆ๋˜ ์ค‘์š” ๊ธฐ์ˆ ๊ณผ (2) ํ•ด๋‹น ๊ธฐ์ˆ ์ด ์ ์šฉ๋œ ์›๋ฆฌ์™€ ์‹œ์‚ฌํ•˜๋Š” ์  ์— ๋Œ€ํ•œ ๋‚ด์šฉ์„ ๋‹ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. Chapter #1 - ChatGPT๋ฅผ ์„ฑ๊ณต์ผ€ ๋งŒ๋“  ์ค‘์š” ๊ธฐ์ˆ ์€ ๋ฌด์—‡์ผ๊นŒ ์™œ GPT-3๋Š” ์•ˆ๋˜๋Š” ๊ฑธ ChatGPT๋Š” ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋œ ๊ฒƒ์ธ๊ฐ€์š”? ์ตœ๊ทผ ํ™”์ œ๊ฐ€ ๋˜๊ณ  ์žˆ๋Š” chatGPT ChatGPT ๊ฐ€ ๊ณต๊ฐœ๋œ์ง€ 2๋‹ฌ์ด ๋‹ค ๋˜์–ด๊ฐ€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ChatGPT๋Š” ์ถœ์‹œ 5์ผ๋งŒ์— ์‚ฌ์šฉ์ž 100๋งŒ๋ช…์„ ๋‹ฌ์„ฑํ•˜๊ณ , ๋†€๋ž๋„๋ก ์ •ํ™•ํ•œ ์–ธ์–ด ๊ตฌ์‚ฌ๋Šฅ๋ ฅ๊ณผ ์ •๋ง ๋„์›€์ด ๋  ๋ฒ•ํ•œ ๋‹ต๋ณ€๋“ค์„ ๋ณด์—ฌ์ฃผ๋ฉด์„œ ๊ตฌ๊ธ€ ๊ฒ€์ƒ‰์„ ๋Œ€์ฒดํ•  ์ˆ˜๋„ ์žˆ๋‹ค๋Š” ์ด์•ผ๊ธฐ๊ฐ€ ๋‚˜์˜ค๋ฉด์„œ ๋งŽ์€ ํ™”์ œ๋ฅผ ๋ถˆ๋Ÿฌ์ผ์œผ์ผฐ๋Š”๋ฐ์š”. ์ตœ๊ทผ์—๋Š” ์˜ํ•™๋…ผ๋ฌธ ์‚ฌ์ „ ๊ณต๊ฐœ ๋ˆ„๋ฆฌ์ง‘ ๋ฉ”๋“œ์•„์นด์ด๋ธŒ(MedRxiv)์— ์ฑ—์ง€ํ”ผํ‹ฐ๊ฐ€ ๋…ผ๋ฌธ ๊ณต์ €์ž๋กœ ์ ํžŒ..