Confusion Matrixとは
Confusion Matrix(混合行列)は、分類結果におけるパターンを表に表した物です。
右のような表です。
行が予測結果、列が正解を表しています。
図 Confusion Matrix
Confusion Matrixの各セルの意味
TP | Positiveと予想した事象が、実際にもPositiveであった。 |
---|---|
TN | Negativeと予想した事象が、実際にもNegativeであった。 |
FP | Positiveと予想した事象が、実際にはNegativeであった。 |
FN | Negativeと予想した事象が、実際にはPositiveであった。 |
モデルの性能評価
- Accuracy(正解率)
- Recall(再現率)
- Precision(適合率)
- F値
Accuracy
Accuracyは、全体に対するTPの割合です。
$$
Accuracy = \frac{TP}{TP+TN+FP+FN}
$$
Recall
実際にPositiveな事象を、Positiveと予想できた割合です。
$$
Recall = \frac{TP}{TP+FN}
$$
Precision
Positiveと予想した事象が、実際にもPositiveであった割合です。
$$
Precision = \frac{TP}{TP+FP}
$$
F値
RecallとPrecisionの調和平均です。
$$
\begin{align}
F score &= \frac{2}{\frac{1}{Recall} + \frac{1}{Precision}} \\
&= \frac{2Recall⋅Precision}{Recall+Precision}
\end{align}
$$
感度と特異度
感度
感度(sensitivity)は、実際にPositiveな事象を、Positiveと予測できた割合です。
感度とRecallは同じになります。
$$
Sensitivity = \frac{TP}{TP+FP}
$$
特異度
特異度(specificity)は、実際にNegativeな事象を、Negativeと予測できた割合です。
$$
Specificity = \frac{TN}{TN + FP}
$$