分類問題の評価指標

機械学習

2値分類の予測をする際の指標を解説

予測が陽 予測が陰
正解が陽 TP:真陽性 FN:偽陰性
正解が陰 FP:偽陽性 TN:真陰性

正解率(Accuracy)

予測結果全体と、答えがどれぐらい一致しているかを判断する指標。
計算式は下記の通り
$latex Accuracy = \frac{TP + TN}{TP+FP+FN+TN}&s=3$
データが陽性か陰性に偏っている場合には高くなりやすい。

適合率(Precision)

陽性と予測したときに実際の陽性がどれだけ含まれているかを測る指標
計算式は下記の通り
$latex Precision = \frac{TP}{TP+FP}&s=3$
陽性と予測したものが少ない場合には数値が高くなりやすい、陰性と予測する方に偏ると高くなりやすい。

再現率(Recall)

実際の陽性のうちどれだけ陽性と予測できているのかを測る指標
計算式は下記の通り
$latex Recall = \frac{TP}{TP+FN}&s=3$
実際の陽性の数が少ない場合には数値が高くなりやすく、予測も陽性に偏るような場合は高くなりやすい。

F値(F-measure)

適合率と再現率がトレードオフの関係にあるので、調和平均をとった指標
計算式は下記の通り
$latex F-measure = \frac{2*Precision*Recall}{Precision + Recall}&s=3$

コメント

タイトルとURLをコピーしました