Distribution of Predicted Probabilities#

トレーニングデータに対して予測した結果の予測確率(確信度)の分布を表示する。もしキャリブレーションが行われていれば、キャリブレーション後の分布が表示される。また、分布とともにカーネル密度推定グラフ(曲線)が重ねられている。

2値分類#

2値分類においては、Yes と予測した際の確信度のヒストグラムになっている。つまり0.5より小さければ No、大きければ Yes のラベルが分かれることになる。もしどちらかのラベルに一方的にサンプルが偏っている場合や、0.5 (確信度が五分五分で自信を持って分類できていない)の周りにサンプルが集中してしまっている場合は、モデルの性能を疑う必要が出てくる。

_images/3-8-7-1.png

Fig. 27 予測確率の分布の例(2値分類)#

多値分類#

多値分類の場合は、複数のラベルのヒストグラムとなる。

_images/3-8-8-1.png

Fig. 28 予測確率の分布の例(多値分類)#

回帰#

ただし回帰の場合は(予測確率が与えられないので) Distribution of prediction results が表示される。

_images/3-8-9-1.png

Fig. 29 予測値の分布の例(回帰)#