Notebook を読み解こう(gluon_predict)#
Prediction step#
モデルの読み込み#
以下のパスからモデルをロードする。
model_name:
が指定されていた場合:{td_account_id}/{td_user_id}/{model_name}
shared_model
が指定されていた場合:{td_account_id}/shared/{shared_model}
Important
model_name:
が指定されていた場合には、実行しているユーザーが作成したモデルでないと呼び出すことができないことに注意。
###モデルと特徴量の確認
ロードされたモデルが何であったかと、モデルに使用している特徴量一覧を表示。
['gender',
'seniorcitizen',
'partner',
'dependents',
'tenure',
'phoneservice',
'multiplelines',
'internetservice',
'onlinesecurity',
'onlinebackup',
'deviceprotection',
'techsupport',
'streamingtv',
'streamingmovies',
'contract',
'paperlessbilling',
'paymentmethod',
'monthlycharges',
'totalcharges']
モデルに使用された特徴量一覧
Note
input_table
で指定したテーブルが、上記の特徴量のカラムをすべて持っておかないと予測が実行できない。例えば ‘internetservice’ カラムが抜けていると、以下のエラーが出ることになる。
KeyError: "1 required columns are missing from the provided dataset to transform using AutoMLPipelineFeatureGenerator. Missing columns: ['internetservice']"
Distribution of predicted probabilities#
テストデータ(予測対象のテーブル)に対して予測した結果の予測確率(確信度)の分布を表示する。
2値分類#
多値分類#
多値分類の場合は、複数のラベルのヒストグラムとなる。
回帰#
ただし回帰の場合は(予測確率が与えられないので) Distribution of prediction results が表示される。
input_table 内に target_column が含まれている場合#
input_table
に target_column
(モデルが予測しようとしているカラム)に存在している場合には、predicted_${target_column}
のカラム名で予測結果が付与される。また、この時、training data と同様、真のラベルと予測したラベルの双方を持つことになるので、以下のモデルの評価指標が input_table
に対して求められて出力されることになる。
2値分類、多値分類#
回帰#
予測結果のテーブル書き込み#
output_mode
オプションが append の場合はレコードを上書き、そうでなければテーブルの置換によって output_table
に指定されたテーブル名で書き込まれる。
Master Segment の attribute_table に追加する設定を行った場合に#
オーディエンススタジオとの連携を参照。