Distribution of Predicted Probabilities#
トレーニングデータに対して予測した結果の予測確率(確信度)の分布を表示する。もしキャリブレーションが行われていれば、キャリブレーション後の分布が表示される。また、分布とともにカーネル密度推定グラフ(曲線)が重ねられている。
2値分類#
2値分類においては、Yes と予測した際の確信度のヒストグラムになっている。つまり0.5より小さければ No、大きければ Yes のラベルが分かれることになる。もしどちらかのラベルに一方的にサンプルが偏っている場合や、0.5 (確信度が五分五分で自信を持って分類できていない)の周りにサンプルが集中してしまっている場合は、モデルの性能を疑う必要が出てくる。

Fig. 27 予測確率の分布の例(2値分類)#
多値分類#
多値分類の場合は、複数のラベルのヒストグラムとなる。

Fig. 28 予測確率の分布の例(多値分類)#
回帰#
ただし回帰の場合は(予測確率が与えられないので) Distribution of prediction results が表示される。

Fig. 29 予測値の分布の例(回帰)#