Notebook を読み解こう(gluon_predict)#

Prediction step#

モデルの読み込み#

以下のパスからモデルをロードする。

  • model_name: が指定されていた場合:

    • {td_account_id}/{td_user_id}/{model_name}

  • shared_model が指定されていた場合:

    • {td_account_id}/shared/{shared_model}

Important

model_name: が指定されていた場合には、実行しているユーザーが作成したモデルでないと呼び出すことができないことに注意。

###モデルと特徴量の確認

ロードされたモデルが何であったかと、モデルに使用している特徴量一覧を表示。

_images/3-8-6-1.png

Fig. 52 ロードした model#

['gender',
 'seniorcitizen',
 'partner',
 'dependents',
 'tenure',
 'phoneservice',
 'multiplelines',
 'internetservice',
 'onlinesecurity',
 'onlinebackup',
 'deviceprotection',
 'techsupport',
 'streamingtv',
 'streamingmovies',
 'contract',
 'paperlessbilling',
 'paymentmethod',
 'monthlycharges',
 'totalcharges']

モデルに使用された特徴量一覧

Note

input_table で指定したテーブルが、上記の特徴量のカラムをすべて持っておかないと予測が実行できない。例えば ‘internetservice’ カラムが抜けていると、以下のエラーが出ることになる。

KeyError: "1 required columns are missing from the provided dataset to transform using AutoMLPipelineFeatureGenerator. Missing columns: ['internetservice']"

Distribution of predicted probabilities#

テストデータ(予測対象のテーブル)に対して予測した結果の予測確率(確信度)の分布を表示する。

2値分類#

_images/3-10-1-1.png

Fig. 53 予測確率の分布の例(2値分類)#

多値分類#

多値分類の場合は、複数のラベルのヒストグラムとなる。

_images/3-10-2-1.png

Fig. 54 予測確率の分布の例(多値分類)#

回帰#

ただし回帰の場合は(予測確率が与えられないので) Distribution of prediction results が表示される。

_images/3-10-3-1.png

Fig. 55 予測値の分布の例(回帰)#

input_table 内に target_column が含まれている場合#

input_tabletarget_column(モデルが予測しようとしているカラム)に存在している場合には、predicted_${target_column} のカラム名で予測結果が付与される。また、この時、training data と同様、真のラベルと予測したラベルの双方を持つことになるので、以下のモデルの評価指標が input_table に対して求められて出力されることになる。

予測結果のテーブル書き込み#

output_mode オプションが append の場合はレコードを上書き、そうでなければテーブルの置換によって output_table に指定されたテーブル名で書き込まれる。