๋จธ์ ๋ฌ๋ ํ๋ก์ ํธ๋ฅผ ๋จ๊ณ๋ณ๋ก ๊ฐ์ ํ๋ ๋ฐฉ๋ฒ #1
์ด ๊ธ์ Structuring Machine Learning Projects ๋ผ๋ ๊ฐ์ ๋ด์ฉ์ ๋ฐํ์ผ๋ก, ํ์์ ๊ฒฝํ๊ณผ ์๊ฒฌ์ ๋ง๋ถ์ธ ๊ธ์ ๋๋ค.
(1) ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์์ธก ์ ํ๋๋ฅผ ๋ ๋์ด๊ณ ์ถ์ ๊ฒฝ์ฐ์ ๋ค์ํ ์ ํ์ง
(2) Chain Assumptions in ML
(3) ๊ธฐํ ๊ฒฝํ์ ์ธ Tips
์ ๋ํ ๋ด์ฉ์ ๋ด๊ณ ์์ต๋๋ค.
* ์ ๊ฐ์ : Structuring Machine Learning Projects
"๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ด ์ ๋์ํ์ง ์์ ๋, ์ฐ๋ฆฌ๋ ์ด๋ป๊ฒ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์์๊น?"
1. ๋จธ์ ๋ฌ๋ ํ๋ก์ ํธ๋, ์ ํํ๋ ๋จ๊ณ๋ค๋ก ๋๋ ์ ์๋ค.
2. ๋ด ํ๋ก์ ํธ๊ฐ ์ด๋ ๋จ๊ณ์์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋์ง ํ์ ํ๋ค.
3. ํด๋น ๋จ๊ณ์ ์ ํฉํ ๋ฐฉ๋ฒ๋ก ์ ์๋ํ์ฌ ์ฑ๋ฅ์ ๊ฐ์ ํ๋ค.
ํ๋ก๋์ ๋ ๋ฒจ์์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๋ง๋ค ๋, ์์๋ณด๋ค ๋ชจ๋ธ ์ฑ๋ฅ์ด ์ ๋์ค์ง ์๋ ์ํฉ์ ์ข ์ข ๊ฒฝํํ๊ฒ ๋ฉ๋๋ค.
"๋ชจ๋ธ ์ฑ๋ฅ์ด ์ข์ง ์์" ์ด๋ผ๋ ํ๋์ ๊ฒฐ๊ณผ์ ๋ํด ์๋ง์ ์์ธ์ด ์์ ์ ์๋๋ฐ์, ์ด๋ฐ ์ํฉ์์ ์ง์ง ์์ธ์ ์ฐพ์๋ด๋ ๋ฐ ์๋นํ ๋ ธ๋ ฅ์ด ํ์ํฉ๋๋ค.
์ด์ ๋ํด Coursera์ Landing AI ์ฐฝ์ ์๋ก ์ ๋ช ํ Andrew Ng ๊ต์๋์ด ๊ตฌ์กฐ์ ์ธ ์ ๊ทผ ๋ฐฉ๋ฒ์ ์ ์ํ ๋ด์ฉ์ด ์์ด ์๊ฐ ๋๋ฆฌ๊ณ ์ ํฉ๋๋ค. (CS229์ ๊ฐ์ ์ ๋ช ํ ๊ฐ์๋ค์ ๋นํด ์ด ๊ฐ์๋ ๋ ์๋ ค์ง ๋ฏ ํ๋ค์.) ์ด๋ ต์ง ์์ ๋ด์ฉ์ด์ง๋ง, ๋จธ์ ๋ฌ๋ ํ๋ก์ ํธ๋ฅผ ๊ตฌ์กฐ์ ์ผ๋ก ์ ๊ทผํ๋ค๋ฉด ๋ฌธ์ ์์ธ์ ํ์ ํ๊ธฐ ์ํ ์๊ฐ์ ์๋นํ ์ ์ฝํ ์ ์์ต๋๋ค.
1. ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์์ธก ์ ํ๋๋ฅผ ๋ ๋์ด๊ณ ์ถ์ ๊ฒฝ์ฐ์ ๋ค์ํ ์ ํ์ง
- ๋ฌธ์ ์ธํ
์ ๋ฐ๊ฟ๋ณธ๋ค.
- ์ ์ ๊ฒฝ์ฐ, ์ค์ ๋ก ๊ฐ์ฅ ๋ง์ด ๋ฌธ์ ๊ฐ ๋์๋ ์ผ์ด์ค ์ ๋๋ค.
- ๊ฐ ํ์ ๊ตฌ์ฑํ๋ ๋ฐ์ดํฐ์ ์ ๋ต์ง๋ฅผ ๋ฐ๊ฟ ๋ด ๋๋ค.
- ํนํ Train-valid-predict ์์ ๋์ผํ ๋ฐ์ดํฐ ํํ๋ก ๋ฌธ์ ๋ฅผ ๊ตฌ์ฑํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.
- ์๋ฅผ ๋ค์ด "๊ณ ๊ฐ key - ํด๋น ๊ณ ๊ฐ์ด ์ค๋ ์ํ key - ํด๋ฆญ ์ฌ๋ถ" ์ ๊ธฐ์ค์ผ๋ก ๊ฐ ํ์ ๊ตฌ์ฑํ๋ฉด, predict ์์ ๋ฌธ์ ๊ฐ ๋ฉ๋๋ค.
- ์๋ํ๋ฉด ๊ฒฐ๊ตญ ํ๊ณ ์ ํ๋ ๊ฒ์ ๋ด์ผ ํด๋น ๊ณ ๊ฐ์ด ์ด๋ค ์ํ์ ํด๋ฆญํ ํ๋ฅ ์ด ๋์์ง ์๊ณ ์ถ์ ๊ฒ์ธ๋ฐ, "๋ณธ ์ํ ์ค์์ ๋ฌด์์ ํด๋ฆญํ ์ง" ๋ฅผ ๋ง์ถ๋ ๋ฌธ์ ๋ก ์ธํ
ํ๋ฉด, ํด๋น ๊ณ ๊ฐ์ด "๋ด์ผ ์ด๋ค ์ํ์ ๋ณผ ์ง" ๋ฅผ ์๊ธฐ๊ฐ ์ด๋ ต๊ธฐ ๋๋ฌธ์
๋๋ค.
- ๋ฌผ๋ก ๋ด์ผ ์ด๋ค ์ํ๋ค์ด ๋ ธ์ถ๋ ์ง๋ฅผ ์์ธกํ๊ฑฐ๋ ์ ์ดํ ์ ์๋ค๋ฉด, ์ด๋ ๊ฒ ๋ฌธ์ ๋ฅผ ์ธํ ํด๋ ๋ฌด๊ดํฉ๋๋ค.
- ์ด ๊ฒฝ์ฐ, "๊ณ ๊ฐ key - ํด๋น ๊ณ ๊ฐ์๊ฒ ์ถ์ฒ ๋ชจ๋ธ์ด ์ค๋ ์ถ์ฒํ ์ํ key - ํด๋ฆญ ์ฌ๋ถ" ๋ก ๋ฌธ์ ๋ฅผ ๊ตฌ์ฑํ๋ฉด train-predict ์์ ๋์ผํ ๋ฌธ์ ๋ฅผ ํ๊ฒ ๋๋ฏ๋ก ๋ชจ๋ธ์ด ์ํ๋๋๋ก ๋์ํ๊ฒ ๋ฉ๋๋ค.
- ๋ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ค.
- ๋ฌผ๋ก ์ค์ ํ๋ก๋์
ํ๊ฒฝ์์ ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐ๋ก ๋ ์์งํ ์ ์๋ ๊ฒฝ์ฐ๋ ๋ง์ง ์์ต๋๋ค. ์๊ฐ/์ธ๊ฑด๋น ๋ฑ์ด ์ถ๊ฐ๋ก ์์๋๋ ๊ฒฝ์ฐ๊ฐ ๋๋ถ๋ถ์ด๊ธฐ ๋๋ฌธ์ด์ฃ .
- ๋ฐ์ดํฐ ์์ง์๋ ๋๋ถ๋ถ ๋น์ฉ์ด ๋ฐ์ํ๊ณ , ์ด๋ฌํ ์ด์ ๋ก ๋ฐ์ดํฐ๋ง ์ ์์ ๋ ์คํํธ์ ์ด๋ผ๋ ๋์ ๊ฐ์น๋ฅผ ์ธ์ ๋ฐ์ ๊ฒฝ์ฐ๋ค์ด ์์์ต๋๋ค.
- ๋์ ๋ฐ์ดํฐ ํ์ฉ ๊ธฐ๊ฐ(์> 2์ฃผ์ผ์์ 1๋ฌ๋ก..)์ ๋๋ฆฌ๋ ๋ฑ์ ์๋๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
- ๋๋ ์ฌ๋ด์ ๋ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์ ์๋ ํํ๋ก ๋ฌธ์ ์ธํ ์ ๋ฐ๊ฟ ๋ณผ ์๋ ์์ต๋๋ค. (ํ ๊ตฌ์ฑ, ์ ๋ต์ง)
- ๋ฌผ๋ก ์ค์ ํ๋ก๋์
ํ๊ฒฝ์์ ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐ๋ก ๋ ์์งํ ์ ์๋ ๊ฒฝ์ฐ๋ ๋ง์ง ์์ต๋๋ค. ์๊ฐ/์ธ๊ฑด๋น ๋ฑ์ด ์ถ๊ฐ๋ก ์์๋๋ ๊ฒฝ์ฐ๊ฐ ๋๋ถ๋ถ์ด๊ธฐ ๋๋ฌธ์ด์ฃ .
- ๋ ๋ค์ํ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ค.
- ํ์ต ๋ฐ์ดํฐ ๊ตฌ์ฑ์ ํธํฅ์ด ๋ฐ์ํ ๊ฒฝ์ฐ, ์๊ณ ๋ฆฌ์ฆ์ ์์ธก๋ ฅ์ด ๋จ์ด์ง ์ ์์ต๋๋ค.
- ์๋ฅผ ๋ค์ด ์ด๋ค ๋๋ฌผ์ด ๊ณ ์์ด์ธ์ง ๋ถ๋ฅํด ๋ด๋ ๋ชจ๋ธ์ ๋ง๋ค์๋๋ฐ ํ์ต ๋ฐ์ดํฐ์ ๋ ธ๋ฅด์จ์ด์ฒ ๊ณ ์์ด๋ฐ์ ์๋ค๋ฉด, ์ฝ์ ๊ณ ์์ด์ ๋ํด์๋ ์์ธก ์ ํ๋๊ฐ ๋จ์ด์ง๊ฒ ๋ฉ๋๋ค.
- Data augmentation ๊ณผ ๊ฐ์ ๊ธฐ๋ฒ์ ์ฌ์ฉํ๊ธฐ๋ ํฉ๋๋ค.
- ๋ชจ๋ธ์ ๋ ์ค๋ ํ์ต ์ํจ๋ค.
- Gradient Descent ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ๋ฐ์ผ๋ก ํ์ต์ํฌ ๊ฒฝ์ฐ, ํ์ต ์๊ฐ/epoch๊ฐ ๋ถ์กฑํ ๊ฒฝ์ฐ์ ๋ฐ์ํ ์ ์์ต๋๋ค.
- ํ์ต์ ๋ ์ค๋ ์ํฌ์๋ก Validation Loss (๊ฒ์ฆ ๋ฐ์ดํฐ ์ ์ ๋ํ)๊ฐ ๊ฐ์ํ๋ ๊ฒฝ์ฐ์๋ง ์๋ฏธ๊ฐ ์์ต๋๋ค. (Training Loss๊ฐ ์๋๋ผ Validation Loss๊ฐ ๊ธฐ์ค)
- Adam ๋ฑ ๋ค์ํ Optimizer๋ฅผ ์ฌ์ฉํด ๋ณธ๋ค.
- Optimizer ์ข ๋ฅ์ ๋ฐ๋ผ ์ต์ ํ๋ฅผ ํ๋ ๋ฐฉ์์ด ์กฐ๊ธ์ฉ ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ ๋ค๋ฅธ optimizer๋ฅผ ์๋ํด ๋ณผ ์ ์์ต๋๋ค.
- Naver Deview ์ ๋ฐ๋ฅด๋ฉด ๋ ผ๋ฌธ์ SOTA ์ฑ๋ฅ์ ์ป์ด ๋ด๋ ๋ฐ SGD๊ฐ ๋ ์๋๋ ์ผ์ด์ค๊ฐ ๋ ๋ง์๋ค๊ณ ํ๋ค์.
- ๋ ํฐ Neural network๋ฅผ ์ฌ์ฉํด ๋ณธ๋ค. / Hidden Unit์ ๊ฐ์๋ฅผ ๋๋ ค ๋ณธ๋ค.
- ํ๊ณ ์ ํ๋ ๋ฌธ์ ์ ๋ณต์ก์ฑ์ ๋นํด ๋ชจ๋ธ์ ๊ตฌ์กฐ๊ฐ ๋จ์ํ์ฌ component ๊ฐ์ ์ถฉ๋ถํ ๊ด๊ณ๋ฅผ ํํํ์ง ๋ชปํ๋ ๊ฒฝ์ฐ
- ๋ ์์ Neural network๋ฅผ ์ฌ์ฉํด ๋ณธ๋ค.
- ๋ฐ์ดํฐ๊ฐ ๊ฐ์ง ์ ๋ณด๋์ ๋นํด ์ง๋์น๊ฒ ๋ณต์กํ ๋ชจ๋ธ์ ์ฌ์ฉํ ๊ฒฝ์ฐ, ์คํ๋ ค ๋ชจ๋ธ ํผํฌ๋จผ์ค๊ฐ ๋ฎ์์ง๋ ๊ฒฝ์ฐ๊ฐ ์๊ธฐ ๋๋ฌธ
- Dropout์ ์๋ํด ๋ณธ๋ค. / L_2 Regularization์ ์ถ๊ฐํ๋ค.
- Overfitting์ ๋ฐฉ์งํ๊ธฐ ์ํจ์ ๋๋ค.
- ๋ชจ๋ธ์ ๊ตฌ์กฐ๋ฅผ ๋ฐ๊ฟ ๋ณธ๋ค.
- ์์๋ฅผ ๊ฐ์ง ๋ฐ์ดํฐ๋ผ๋ฉด Transformer ๊ณ์ด์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ฐ๋ ๊ฒ์ด ํจ๊ณผ์ ์ผ ์ ์์ต๋๋ค.
- Activation ํจ์๋ฅผ ๋ฐ๊ฟ ๋ณธ๋ค.
์์ ๋ค์ํ ์ ํ์ง ์ค, ๋ฌด์์ด ์ ์ ํ ์ ํ์ง์ธ์ง ๋น ๋ฅด๊ฒ ์ ์๋ ์์๊น?
- ML ์์คํ ๊ตฌ์ถ ์์ ์ด๋ ค์ด ์ : ํ๋์ ๋ฌธ์ ๋ฅผ ํ๊ธฐ ์ํด ์ ์ฉํด ๋ณผ ์ ์๋ ๋ฐฉ๋ฒ๋ก ์ด ๋ค์ํ๊ณ , ๋ฐ๊ฟ๋ณผ ์ ์๋ ํญ๋ชฉ (๋ชจ๋ธ ๊ตฌ์กฐ, ์ด๋ชจ์ ๋ฑ..)์ด ๋ฌด์ํ ๋ง๋ค.
- ML์ ๋๊ฐ๋ค์, A๋ผ๋ ์์น๋ฅผ ๋ณํ์ํค๊ธฐ ์ํด B๋ผ๋ ํญ๋ชฉ์ ํ๋ํด์ผ ํ๋ ๊ฒ์ ์๊ณ ์๊ธฐ ๋๋ฌธ์ ์ ํ ์ ์๋ค.
- Andrew Ng ๊ต์๋์ ์ ๋ด์ฉ์ orthogonalization (ํ๋ ฌ ์ด๋ก ์์์ orthogonalization ๊ณผ๋ ๋ค๋ฅด๋ค.) ์ด๋ผ๋ ๊ฐ๋ ์ผ๋ก ํํํฉ๋๋ค.
2. Chain of Assumptions in ML
- ๋จธ์ ๋ฌ๋ ํ๋ก์ ํธ๋ ์ฌ๋ฌ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋๋ฉฐ, ํด๋น ๋จ๊ณ๋ง๋ค ํ๋์ด ํ์ํ ํญ๋ชฉ๋ค์ด ์ด๋์ ๋ ์ ํด์ ธ ์์ต๋๋ค.
- ํ์ต ๋ฐ์ดํฐ์ ์ fitting ๋์ด์ผ ํ๋ค. (=Fit training set well on cost function)
- ์ fitting ์ํจ๋ค์ ๊ธฐ์ค? ์ฌ๋์ด ์ ํ๋ ๋ถ์ผ (์> ์ด๋ฏธ์ง ๋ถ๋ฅ)์์๋ ์ฌ๋๊ณผ ์ ์ฌํ ์์ค์ ์๋ฏธํฉ๋๋ค.
- ๋ง์ฝ Training ๊ณผ์ ์์ metric (F1-score, RMSE ๋ฑ..)์ด ์ํ๋ ์์ค๋งํผ ์ ์๋์จ๋ค๋ฉด ์๋ ๋ฐฉ๋ฒ๋ก ๋ค์ ์๋ํด ๋ณผ ์ ์์ต๋๋ค.
1. ๋ฐ์ดํฐ์ ๋ง๊ฒ ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ๋ฐ๊ฟ๋ณธ๋ค.
(gbm, transformer, ...)2. SGD ๋ฑ ๋ค์ํ Optimizer๋ฅผ ์ฌ์ฉํด ๋ณธ๋ค.
- ๊ฒ์ฆ ๋ฐ์ดํฐ์ ์ fitting ๋์ด์ผ ํ๋ค. (=Fit Validation set well on cost function)
- ๋ง์ฝ Validation ๊ณผ์ ์์ metric์ด ์ ๋์ค์ง ์๋๋ค๋ฉด, ์๋ ๋ฐฉ๋ฒ๋ก ๋ค์ ์๋ํด ๋ณผ ์ ์์ต๋๋ค.
- Training set์ ๋ํด์๋ง ์ fitting๋ ๊ฒฝ์ฐ, ์๋ก์ด ๋ฐ์ดํฐ์ ๋ํด ์ ์์ธกํ์ง ๋ชปํ๋ overfitting ๋ฌธ์ ๊ฐ ๋ฐ์ํ์ ๊ฐ๋ฅ์ฑ์ด ์๊ธฐ ๋๋ฌธ์
๋๋ค. ๋ฐ๋ผ์ overfitting์ ์ค์ฌ์ค ์ ์๋ L_2 regularization, Cross Validation (์ผ์ข
์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋๋ฆฌ๋ ํจ๊ณผ๋ ์์), Dropout ๋ฑ์ ์๋ํด ๋ณผ ์ ์์ต๋๋ค.
1. Regularization 2. ๋ ํฐ ํ์ต ๋ฐ์ดํฐ์ ์ ํ์ฉํด ๋ณธ๋ค. 3. class imbalance ๋ฌธ์ ๊ฐ ์๋์ง ํ์ธํ๊ณ ,
undersampling ์ด๋ oversampling์ ์๋ํด ๋ณธ๋ค.
- ํ
์คํธ ๋ฐ์ดํฐ์ ์ fitting ๋์ด์ผ ํ๋ค. (=Fit Test set well on cost function)
- ํ ์คํธ ๋ฐ์ดํฐ๋ ๋ณดํต D+1 ๋ฐ์ดํฐ์ ๊ฐ์ด, ์ค์ ํ๋ก๋์ ์์ ์์ธก์ด ์๋ฏธ๊ฐ ์๋ ๋ฐ์ดํฐ๋ก ๊ตฌ์ฑํฉ๋๋ค.
- ๋ง์ฝ test ๊ณผ์ ์์ metric์ด ์ ๋์ค์ง ์๋๋ค๋ฉด, ์๋ ๋ฐฉ๋ฒ๋ก ์ ์๋ํด ๋ณผ ์ ์์ต๋๋ค.
- ํน์ Validation Set์ ๋ํด์๋ง Overfitting์ด ์ด๋ฃจ์ด์ก์ ์ ์๊ธฐ ๋๋ฌธ์, ๊ฒ์ฆ ๋ฐ์ดํฐ์
์ ๋ ํฌ๊ฒ ํ์ฌ ํ
์คํธ ์
๊ณผ ์ ์ฌํ๊ฒ ๊ตฌ์ฑํ๋ ค๋ ๋ชฉ์ ์
๋๋ค.
1. ๋ ํฐ ๊ฒ์ฆ ๋ฐ์ดํฐ์ ์ ํ์ฉํด ๋ณธ๋ค.
- ๋ชจ๋ธ ๊ตฌ์ฑ ์ดํ ์์ฑ๋๋ ํ์ค ์ธ๊ณ์ ๋ฐ์ดํฐ์
์ ๋ํด ์ fitting์ด ๋์ด์ผ ํ๋ค. (=Fit well on real world problem)
- ๋ชจ๋ธ ๋ฐฐํฌ ํ, ์ฑ๋ฅ์ด ์ ๋์ค์ง ์๋๋ค๋ฉด ๊ฒ์ฆ ๋ฐ์ดํฐ์ ํ ์คํธ ๋ฐ์ดํฐ๊ฐ ํ๋ก๋์ ๋ ๋ฒจ์์์ ๋ฐ์ดํฐ๋ฅผ ์ถฉ๋ถํ ๋ฐ์ํ์ง ๋ชปํ ์ด์ ๊ฐ ์์ ์ ์์ต๋๋ค.
- ํน์ ๋ฌธ์ ์ธํ
์ด ์ฒ์๋ถํฐ ์๋ชป ๋์ง๋ ์์๋์ง ๋ค์ ํ ๋ฒ ํ์ธํฉ๋๋ค.
1. ๊ฒ์ฆ ๋ฐ์ดํฐ/ ํ ์คํธ ๋ฐ์ดํฐ ์ ์ด ํ์ค ์ธ๊ณ ๋ฐ์ดํฐ์ ์ ์ฌํ๋๋ก,
์ฌ๊ตฌ์ฑ ํ๋ค.2. Cost function์ ๋ฐ๊ฟ ๋ณธ๋ค.
(๋ฌธ์ ์ ์๊ฐ ์๋ชป๋ ๊ฒฝ์ฐ)
3. ๊ธฐํ ๊ฒฝํ์ ์ธ Tips
- class imbalance ๋ฌธ์ ํด๊ฒฐ
- ํผ์ฒ๊ฐ ๋ง์์๋ก oversampling ๋ฐฉ๋ฒ๋ก ์ ์ฐ์ฐ๋์ด ๋งค์ฐ ๋ง์ด ํ์ํ๊ธฐ ๋๋ฌธ์, undersampling์ด ์ ๋ฆฌํฉ๋๋ค.
- undersampling์ ์์์ธ ํด๋์ค์ ๋ฐ์ดํฐ๋ ๋ชจ๋ ๋จ๊ธฐ๊ณ , ๋ค์์ธ ํด๋์ค์ ๋ฐ์ดํฐ๋ ์ผ๋ถ๋ง ์ํ๋ง ํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
- ํ ์คํธ ๋ฐ์ดํฐ์์์ ํผํฌ๋จผ์ค๋ฅผ ๊ธฐ์ค์ผ๋ก undersampling ๋น์จ์ ์กฐ์ ํฉ๋๋ค.
- binary classification์์ F1-score๊ณผ ๊ด๋ จ๋ ์ด์
- Precision๊ณผ Recall์ trade-off ๊ด๊ณ์ ์๋๋ฐ์, P๋ R ์ค ํ๋๊ฐ ์ง๋์น๊ฒ ๋์ ๊ฒ์ ์ข์ง ์์ต๋๋ค. ๋ ๊ฐ๊ณผ F1 score๊น์ง ๋น์ทํ ๊ฐ์ ๊ฐ๋ ๊ฒฝ์ฐ์ ์ผ๋ฐ์ ์ผ๋ก ์ฑ๋ฅ์ด ์ข์ต๋๋ค.
- ๋ฌผ๋ก "๊ณต์ฅ์์ ๋ถ๋ํ์ ๋ด๋ฉด ์ ๋๋ ๊ฒฝ์ฐ" ์ ๊ฐ์ด Recall์ด ์๋์ ์ผ๋ก ์ค์ํ ๋ชจ๋ธ๋ค๋ ์๊ณ , ์ด๋ ๋น์ฆ๋์ค ์ํฉ์ ๋ง๊ฒ ๊ฒฐ์ ํด์ผ ํฉ๋๋ค. ์ด ๊ฒฝ์ฐ ๋จ์ F1-score๊ฐ ์๋๋ผ P ํน์ R์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ F-beta score๋ฅผ ์ฌ์ฉํด ๋ณด์ ๋ ์ข์ ๊ฒ ๊ฐ๋ค์.
- ์๋ฅผ ๋ค์ด beta ๊ฐ 2์ธ ๊ฒฝ์ฐ, recall์ precision๋ณด๋ค 2๋ฐฐ ์ค์ํ๊ฒ ์ฌ๊ธฐ๋ ์ผ์ด์ค ์ ๋๋ค.
- Precision๊ณผ Recall ๊ฐ์ ๋น์ค์ ์ฃผ๋ก class weight๋ฅผ ํ์ฉํด์ ์กฐ์ ํ ์ ์์ต๋๋ค. 0/1 ์ค 1์ด ์์ ์นดํ
๊ณ ๋ฆฌ์ธ ๊ฒฝ์ฐ, 1์ ๋ํ class weight๋ฅผ ๋์ผ์๋ก Recall์ด ๋์์ง๊ณ , ๋ฎ์ถ์๋ก Precision์ด ๋์์ง๋๋ค.
- "๋ค์ ํด๋์ค ์ํ ์ / ์์ ํด๋์ค ์ํ ์" ๋ก ๋ณดํต ์ต์ ์ class weight๋ฅผ ์ด์ผ๊ธฐ ํ๋๋ฐ์, ์ ์ ๊ฒฝํ ์ ์ด ๊ฐ์ 1/n ์ ๊ณฑํด์ P-R ๊ท ํ์ ๋ง์ท์ ๋ ๊ฐ์ฅ ํผํฌ๋จผ์ค๊ฐ ์ข์์ต๋๋ค.
- Precision๊ณผ Recall์ trade-off ๊ด๊ณ์ ์๋๋ฐ์, P๋ R ์ค ํ๋๊ฐ ์ง๋์น๊ฒ ๋์ ๊ฒ์ ์ข์ง ์์ต๋๋ค. ๋ ๊ฐ๊ณผ F1 score๊น์ง ๋น์ทํ ๊ฐ์ ๊ฐ๋ ๊ฒฝ์ฐ์ ์ผ๋ฐ์ ์ผ๋ก ์ฑ๋ฅ์ด ์ข์ต๋๋ค.
- Evaluation metric์ ์ ์ค์ ํ๋ ๊ฒ๋ ๋งค์ฐ ์ค์ํฉ๋๋ค. ์์์๋ ์ฃผ๋ก F1-score๋ฅผ ์์๋ก ๋ค์์ง๋ง, ๋ง์ฝ F1-score ๋ณด๋ค ๋ ๋น์ฆ๋์ค์ ์ธ ๋์ฆ๋ฅผ ์ ๋ฐ์ํ๋ metric์ด ์๋ค๋ฉด (์> ndcg) ํด๋น metric์ ์ฌ์ฉํด์ผ ํฉ๋๋ค. ๊ตฌ๋งค ๋๋ ์ ํ์จ๊ณผ์ ์๊ด๊ณ์๋ฅผ ๊ณ์ฐํด ๋ณด๋ ๊ฒ๋ ์ข์ต๋๋ค.
- ์ค์ ์๋น์ค์ ์ ์ฉํ ๊ฒฝ์ฐ, ํ์ต ๋ฟ๋ง ์๋๋ผ inference์ ์์๋๋ ์๊ฐ ๋ฑ ์ ์ฝ ์กฐ๊ฑด์ด ๊ณ ๋ ค๋์ด์ผ ํ๋ ๊ฒฝ์ฐ๋ค๋ ์์ต๋๋ค.
- ์ด ๋๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ฝ๊ฐ ํฌ์ํ๋ฉด์ ์๋ต ์๋๊ฐ ๋น ๋ฅธ ๋ชจ๋ธ์ ์ ํํ ์ ์์ต๋๋ค.
- ํ์ํ ํผ์ฒ๋ฅผ ์ค์ด๊ฑฐ๋, ๋ชจ๋ธ์ ์ฌ๋ฌ ๊ฒน์ผ๋ก ์๊ฑฐ๋, ๋ชจ๋ธ ๊ฒฐ๊ณผ๋ฅผ ๋ฏธ๋ฆฌ ์ ์ฌํด ๋๊ฑฐ๋, ๋ชจ๋ธ์ ๋ฉ๋ชจ๋ฆฌ์ ์ฌ๋ฆฌ๋ ๋ฑ์ ์๋๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค์ ๊ธ์์๋ Error analysis, data mismatch ๋ฑ์ ๋ค๋ฃจ๋๋ก ํ๊ฒ ์ต๋๋ค.
์ฝ์ด ์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค!
