์ธ๊ณต์ง๋ฅ๊ฐ๋ก ๋ค์ ๋ ๋ฐ๋ก ์ดํดํ๋ ๊ฐ๋ ์ธ๋ฐ ์ด๋ฒ์ ์กธ์ํ๋ฉด์ ๋ค์ ์ฐพ์๋ณด๋ ์ ์ง ์ดํด๊ฐ ์ ๋์๋...
๋น ๋ฐ์ดํฐ ์์ ๋ฃ๋ค๊ฐ ๋ ๋์๋๋ฐ ๋คํํ ์ดํด๋์ ์ ๋ฆฌํด๋๋ค.
True Positive
False Positive
True Negative
False Negative
๋ค ๊ฐ๋ ์ ์ค์ ๊ฐ๊ณผ ์์ธก๊ฐ์ ๋ฐ๋ผ ๊ณ์ฐํ๋ฉฐ, ๋ค์์๋ถํฐ ํด์ํ๋ค.
Positive์ Negative๋ ์์ธก๊ฐ์ด ๊ธฐ์ค ๋ ์ด๋ธ๊ณผ ๊ฐ์์ง (์์ธก๊ฐ == ๊ธฐ์ค๊ฐ?) ์ฌ๋ถ์ ๋ฐ๋ผ ๊ฒฐ์ ๋๊ณ
True์ False๋ ๊ทธ๋์ ๊ทธ ์์ธก์ด ๋ง์๋์ง (์์ธก๊ฐ == ์ค์ ๊ฐ?) ์ฌ๋ถ์ ๋ฐ๋ผ ๊ฒฐ์ ๋๋ค.
๊ฐ๋ น 0๊ณผ 1 ๋ ๊ฐ์ง์ ๋ ์ด๋ธ์ ๋ํ์ฌ ๋ถ๋ฅํ๋ ๋ฌธ์ ๋ฅผ ํ์๊ณ , ๋ ์ด๋ธ 0์ ๋ํ์ฌ TP, FP, TN, FN์ ๊ณ์ฐํ๋ค๊ณ ํ์.
True Positive๋ ์์ธก๊ฐ์ด 0์ธ๋ฐ (๊ธฐ์ค ๋ ์ด๋ธ๊ณผ ๋์ผํ๋ฏ๋ก Positive), ์ค์ ๊ฐ๋ 0์ด๋ผ์ ๋ง์ ๊ฒฝ์ฐ (True) ์ด๋ค.
๋๋จธ์ง ์ธ ๊ฐ๋ ๋ ์๊ฐํด๋ณด๋ฉด
False Positive๋ ์์ธก๊ฐ์ด 0์ธ๋ฐ (Positive), ์ค์ ๊ฐ์ 1์ด๋ผ์ ํ๋ฆฐ ๊ฒฝ์ฐ (False)
True Negative๋ ์์ธก๊ฐ์ด 1์ธ๋ฐ (Negative), ์ค์ ๊ฐ๋ 1์ด๋ผ์ ๋ง์ ๊ฒฝ์ฐ (True)
False Negative๋ ์์ธก๊ฐ์ด 1์ธ๋ฐ (Negative), ์ค์ ๊ฐ์ 0์ด๋ผ์ ํ๋ฆฐ ๊ฒฝ์ฐ (False)
์ด๋ค.
๊ทธ๋์ model performance๋ฅผ ์ธก์ ํ๋ metrics
Precision = TP / (TP + FP)
์์ ๋ถ๋ชจ์ธ (TP + FP)๋ "์์ธก์ 0์ด๋ผ๊ณ ํ ๊ฒ๋ค ์ค"์ด๋ผ๊ณ ํด์, ๋ถ์์ธ TP๋ "(์ค์ ๋ 0์ด๋ผ์) ๋ง๊ฒ ์์ธกํ ๊ฒ์ ๋ช ๊ฐ?"๋ผ๊ณ ํด์๋๋ค.
Recall = TP / (TP + FN)
TP๋ (์์ธก=0, ์ค์ =0), FN๋ (์์ธก=1, ์ค์ =0)์ด๋ฏ๋ก (TP + FN)์ ์ค์ ๋ก 0์ธ ๊ฒ๋ค์ด๋ค.
๋ฐ๋ผ์ ๋ถ๋ชจ์ธ (TP + FN)๋ "์ค์ ๋ก 0์ธ ๊ฒ๋ค ์ค"์ด๋ผ๊ณ ํด์, ๋ถ์์ธ TP๋ "(์์ธก๋ 0์ด๋ผ์) ๋ง๊ฒ ์์ธกํ ๊ฒ์ ๋ช๊ฐ?"๋ผ๊ณ ํด์๋๋ค.
F1-Score = 2 * Precision * Recall / (Precision + Recall)
๋ Precision๊ณผ Recall์ ์กฐํํ๊ท ์ด๋ค.
Accuracy = (TP + TN) / (TP + FP + TN + FN)
์์ ๋ถ๋ชจ์ธ (TP + FP + TN + FN)๋ "์ ์ฒด ์ค์"๋ผ๊ณ ํด์, ๋ถ์์ธ (TP + TN)๋ "(์ด์จ๋ ์์ธก == ์ค์ ๋ผ์) ๋ง๊ฒ ์์ธกํ ๊ฒ์ ๋ช ๊ฐ?"๋ผ๊ณ ํด์๋๋ค.
'Data Engineering' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Greenplum Database์ Architecture (0) | 2023.11.10 |
---|---|
๋ฐ์ ๊ทํ (์๋ฏธ, ๋ชฉ์ , ๋์, ๋ฐฉ๋ฒ) (0) | 2023.11.10 |
๋ฐ์ดํฐ ์์ง๋์ด๋ง (0) | 2021.12.20 |
GPDB (vs. PostgreSQL, Architecture, Query) (0) | 2021.05.16 |
Spark/Hadoop ์ด์ฉํ CentOS VM ์ธํ ํ๊ธฐ (2) | 2020.04.16 |
๋๊ธ