Shapley Values

Shapley Values #

Note

Shapley 値はモデルの評価指標ではなく、特徴量ごとのモデルへの影響度を測るものである。

前章の Feature Importance のように、特徴量の予測したモデルへの寄与度を測る手段として SHAP value が存在する。

シャープレイ値（Shapley Value）とは？#

協力ゲーム理論で用いられる Shapley Value は、単独ではなく協力してゲームに参加することによる貢献を考慮した上で分配された報酬を意味する。

「各プレイヤーが新たにゲームに加わり、それによる貢献で賞金がいくら増えるか」を表す限界貢献度（marginal contribution）を用いて、Aさん、Bさん、Cさんの Shapley value（報酬）を出してみよう。

どの順番でAさんが協力に参加するかによって限界貢献度は異なるので、全ての順番における限界貢献度の期待値（平均値）をとり、それをシャープレイ値と呼ぶ。（計算方法は省略）結果、各個人のシャープレイ値は以下のようになる：

Aさん: 25万円（単独の場合30万円）
Bさん: 20万円（単独の場合18万円）
Cさん: 15万円（単独の場合12万円）

シャープレイの考え方に基づくと、BさんとCさんは、単独の力量で配分するよりも、他者と協力することでより多くの報酬をもらえることになる。

機械学習における SHAP 値 #

機械学習の分野においては、このゲーム理論で活用されていたシャープレイ値を機械学習の分野に応用したオープンソースのライブラリである SHAP を利用していくことになる。

ひとつひとつの特徴量がモデル予測値に与える貢献度をシャープレイ値で表そうとしたものが SHAP 値と呼ばれるものであり、シャープレイ値の近似値となっている。純粋なシャープレイ値を求めるためには特徴量のすべての組み合わせを考慮した計算が発生するため、実質的には困難であるためだ。本 Notebook で出力される値は全て SHAP 値となっている。

SHAP 値の特徴 #

あるサンプルのすべての SHAP 値の合計をとると、その予測値 f(x)、分類問題の場合は予測確率）に一致する。

つまり SHAP 値は、Feature Importance のような係数の値ではなく、予測値と同じ単位を持つ具体的な数値となっている。以下の図はあるサンプルに対して、予測値に対して各特徴量の値が SHAP の意味でどれだけ貢献したのかを表現している。

	3
customerid	0927-CNGRH
gender	Male
seniorcitizen	0
partner	No
dependents	Yes
tenure	1
phoneservice	Yes
multiplelines	No
internetservice	No
onlinesecurity	No internet service
onlinebackup	No internet service
deviceprotection	No internet service
techsupport	No internet service
streamingtv	No internet service
streamingmovies	No internet service
contract	Month-to-month
paperlessbilling	No
paymentmethod	Mailed check
monthlycharges	19.55
totalcharges	19.55

2値分類において、あるサンプル3における各特徴量の値のテーブル。このサンプルに対する予測確率 f(x)=0.25 となっている。（これはこのサンプルが No に分類されたことを意味している。）

_images/3-8-24-1.png — Fig. 43 サンプル3における force_plot。数直線上にはこのサンプルの予測値 f(x)=0.25 と、`base value` と呼ばれる全サンプルの予測値の平均値が表示されている。`base value` から、プラスの意味で寄与している赤の特徴量: tenure と、マイナスの意味で寄与している複数の青の特徴量が押し合いへし合いした結果、f(x) の値になったことを意味している。それぞれの特徴量の大きさは、数直線から把握することができている。#

_images/3-8-25-1.png — Fig. 44 SHAP 値の waterfall_plot は、特徴量ごとの SHAP 値が f(x) にどれくらい寄与しているかをより明確に表現している。予測値の平均値である E[f(x)] からスタートし、下方から特徴量ごとの SHAP 値を重ねていき、最終的に予測値の f(x) に辿り着く様子がみて取れる。こここからわかることは、tenure=1 という特徴量の値は、予測確率を 0.22 (22%) 上げる方向に寄与し、internetservice = No という特徴量の値が、予測確率を 0.08 (8%) 下げる方向に寄与していることである。#

SHAP 値の概要を理解したところで、本 Notebook から出力される SHAP 関連の表現をみていこう。どの表現も、サンプルごとの SHAP 値を様々な角度で重ね合わせ、特徴量の寄与を確認することを目的としており、得られる情報はほぼ同じである。扱いやすいものを選んで活用していくことになる。

前述の force_plot を30ほどの複数サンプルに対して適用すると、1つ1つのサンプルの force_plot を左に90度回転して並べたグラフとして表現される。インタラクティブなグラフになっていて、X軸はサンプル番号、Y軸はセレクトボックスから選んだ指標となるが、主に f(x) と各特徴量の SHAP 値となる。X軸情報のセレクトボックスにてサンプルの並び替えの順番を指定することができる。