๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Data Engineering

True/False Positive/Negative ์ •๋ฆฌ

by ํ–‰๋ฑ 2020. 5. 7.

์ธ๊ณต์ง€๋Šฅ๊ฐœ๋ก  ๋“ค์„ ๋• ๋ฐ”๋กœ ์ดํ•ดํ–ˆ๋˜ ๊ฐœ๋…์ธ๋ฐ ์ด๋ฒˆ์— ์กธ์ž‘ํ•˜๋ฉด์„œ ๋‹ค์‹œ ์ฐพ์•„๋ณด๋‹ˆ ์™ ์ง€ ์ดํ•ด๊ฐ€ ์•ˆ ๋์—ˆ๋˜...

๋น…๋ฐ์ดํ„ฐ ์ˆ˜์—… ๋“ฃ๋‹ค๊ฐ€ ๋˜ ๋‚˜์™”๋Š”๋ฐ ๋‹คํ–‰ํžˆ ์ดํ•ด๋˜์„œ ์ •๋ฆฌํ•ด๋‘”๋‹ค.

 

True Positive

False Positive

True Negative

False Negative

 

๋„ค ๊ฐœ๋…์€ ์‹ค์ œ๊ฐ’๊ณผ ์˜ˆ์ธก๊ฐ’์— ๋”ฐ๋ผ ๊ณ„์‚ฐํ•˜๋ฉฐ, ๋’ค์—์„œ๋ถ€ํ„ฐ ํ•ด์„ํ•œ๋‹ค.

Positive์™€ Negative๋Š” ์˜ˆ์ธก๊ฐ’์ด ๊ธฐ์ค€ ๋ ˆ์ด๋ธ”๊ณผ ๊ฐ™์€์ง€ (์˜ˆ์ธก๊ฐ’ == ๊ธฐ์ค€๊ฐ’?) ์—ฌ๋ถ€์— ๋”ฐ๋ผ ๊ฒฐ์ •๋˜๊ณ 

True์™€ False๋Š” ๊ทธ๋ž˜์„œ ๊ทธ ์˜ˆ์ธก์ด ๋งž์•˜๋Š”์ง€ (์˜ˆ์ธก๊ฐ’ == ์‹ค์ œ๊ฐ’?) ์—ฌ๋ถ€์— ๋”ฐ๋ผ ๊ฒฐ์ •๋œ๋‹ค.

 

๊ฐ€๋ น 0๊ณผ 1 ๋‘ ๊ฐ€์ง€์˜ ๋ ˆ์ด๋ธ”์— ๋Œ€ํ•˜์—ฌ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ํ’€์—ˆ๊ณ , ๋ ˆ์ด๋ธ” 0์— ๋Œ€ํ•˜์—ฌ TP, FP, TN, FN์„ ๊ณ„์‚ฐํ•œ๋‹ค๊ณ  ํ•˜์ž.

True Positive๋Š” ์˜ˆ์ธก๊ฐ’์ด 0์ธ๋ฐ (๊ธฐ์ค€ ๋ ˆ์ด๋ธ”๊ณผ ๋™์ผํ•˜๋ฏ€๋กœ Positive), ์‹ค์ œ๊ฐ’๋„ 0์ด๋ผ์„œ ๋งž์€ ๊ฒฝ์šฐ (True) ์ด๋‹ค.

 

๋‚˜๋จธ์ง€ ์„ธ ๊ฐœ๋…๋„ ์ƒ๊ฐํ•ด๋ณด๋ฉด

False Positive๋Š” ์˜ˆ์ธก๊ฐ’์ด 0์ธ๋ฐ (Positive), ์‹ค์ œ๊ฐ’์€ 1์ด๋ผ์„œ ํ‹€๋ฆฐ ๊ฒฝ์šฐ (False)

True Negative๋Š” ์˜ˆ์ธก๊ฐ’์ด 1์ธ๋ฐ (Negative), ์‹ค์ œ๊ฐ’๋„ 1์ด๋ผ์„œ ๋งž์€ ๊ฒฝ์šฐ (True)

False Negative๋Š” ์˜ˆ์ธก๊ฐ’์ด 1์ธ๋ฐ (Negative), ์‹ค์ œ๊ฐ’์€ 0์ด๋ผ์„œ ํ‹€๋ฆฐ ๊ฒฝ์šฐ (False)

์ด๋‹ค.

 

๊ทธ๋ž˜์„œ model performance๋ฅผ ์ธก์ •ํ•˜๋Š” metrics

Precision = TP / (TP + FP)

์—์„œ ๋ถ„๋ชจ์ธ (TP + FP)๋Š” "์˜ˆ์ธก์„ 0์ด๋ผ๊ณ  ํ•œ ๊ฒƒ๋“ค ์ค‘"์ด๋ผ๊ณ  ํ•ด์„, ๋ถ„์ž์ธ TP๋Š” "(์‹ค์ œ๋„ 0์ด๋ผ์„œ) ๋งž๊ฒŒ ์˜ˆ์ธกํ•œ ๊ฒƒ์€ ๋ช‡ ๊ฐœ?"๋ผ๊ณ  ํ•ด์„๋œ๋‹ค.

 

Recall = TP / (TP + FN)

TP๋Š” (์˜ˆ์ธก=0, ์‹ค์ œ=0), FN๋Š” (์˜ˆ์ธก=1, ์‹ค์ œ=0)์ด๋ฏ€๋กœ (TP + FN)์€ ์‹ค์ œ๋กœ 0์ธ ๊ฒƒ๋“ค์ด๋‹ค.

๋”ฐ๋ผ์„œ ๋ถ„๋ชจ์ธ (TP + FN)๋Š” "์‹ค์ œ๋กœ 0์ธ ๊ฒƒ๋“ค ์ค‘"์ด๋ผ๊ณ  ํ•ด์„, ๋ถ„์ž์ธ TP๋Š” "(์˜ˆ์ธก๋„ 0์ด๋ผ์„œ) ๋งž๊ฒŒ ์˜ˆ์ธกํ•œ ๊ฒƒ์€ ๋ช‡๊ฐœ?"๋ผ๊ณ  ํ•ด์„๋œ๋‹ค.

 

F1-Score = 2 * Precision * Recall / (Precision + Recall)

๋Š” Precision๊ณผ Recall์˜ ์กฐํ™”ํ‰๊ท ์ด๋‹ค.

 

Accuracy = (TP + TN) / (TP + FP + TN + FN)

์—์„œ ๋ถ„๋ชจ์ธ (TP + FP + TN + FN)๋Š” "์ „์ฒด ์ค‘์—"๋ผ๊ณ  ํ•ด์„, ๋ถ„์ž์ธ (TP + TN)๋Š” "(์–ด์จŒ๋“  ์˜ˆ์ธก == ์‹ค์ œ๋ผ์„œ) ๋งž๊ฒŒ ์˜ˆ์ธกํ•œ ๊ฒƒ์€ ๋ช‡ ๊ฐœ?"๋ผ๊ณ  ํ•ด์„๋œ๋‹ค.

 

๋Œ“๊ธ€