Minitab Statistical Softwareの予測分析モデルは、どの業界でも非常に貴重な資産になり得ます。顧客離れ、患者の在院期間、コスト、リスク、利益などを含めた多くの要因の測定値を予測することから事業価値を創出することができます。
このブログでは、銀行業界での応用を見ていきます。銀行にとって、適切でない人と住宅ローン契約を結ぶことは、多額の損失につながりかねません。これゆえに、銀行は住宅ローンの申請を承諾または却下する前に、顧客を理解し、顧客について予測することが非常に重要です。Minitab 予測分析で、どの顧客が将来的に返済不履行を起こしそうか正しく予測して、住宅ローン返済不履行の件数を最小化する方法を見ましょう。
住宅ローンのデータを理解する
以下は、分析で使用した観測値データの切り抜きです。以前の顧客の住宅ローンに関する観測値は1,645件あります。列C1に表示されているのは応答変数 (目的変数) です。住宅ローンの返済不履行を起こしている場合は「Yes」、起こしていない場合は「No」となります。他の9列は、潜在的な結果を予測する判断材料として評価される特徴です。
住宅ローンの返済不履行の現状
下の円グラフで、住宅ローンの返済不履行に陥った借り手の割合がわかります。住宅ローンの10%が返済不履行を起こしています。この割合を減らせば、利益を大幅に増やすことができます。
予測モデルを比較する
この課題に取り組むために、Minitab予測分析モジュールを活用します。
このモジュールの詳細は、以下のオンデマンドウェビナーでご確認ください。
応答が「はい」または「いいえ」であるため、分類モデルを使います。連続応答が関係する場合は、木ベースの回帰モデルを使います。予測分析モジュールには、3つの分類モデルタイプが含まれています。
分類の場合、モデルの適合度を評価する主な指標の1つは、ROC曲線の下の領域です。この指標は、1に近いほど、優れています。モジュール内の3つのモデリングエンジンのそれぞれを使って、ROC曲線の下の領域のそれぞれの値を比較しました。
TreeNet分類により、ROC曲線の下には0.9695の領域が生成されました。この値は、他のモデリングエンジン2つのモデルでのROC曲線の下の領域よりも良い結果がでました。つまり、生成されたTreeNet分類モデルが住宅ローンの返済不履行で最良の予測モデルということです。TreeNet勾配ブースティングは、Minitabの受賞歴を誇る強力かつ最も柔軟な機械学習ツールであり、極めて正確なモデルを一貫して生成できます。3つのモデリングエンジンのうち、TreeNetが最良の結果を生成する傾向があります。
重要な予測変数を可視化する
まず、モデル出力の一部として、相対変数重要度グラフを見ましょう。相対変数重要度の値は0~100%で、最も重要な変数はいつでも100%です。住宅ローンの返済不履行を予測する上で最も重要な変数は、「クレジットに対する負債の比率」で、次に重要なのは「収入に対する負債の比率」です。9つの特徴のうち8つの特徴は、モデルにとってある程度重要です。
返済不履行の確率を予測する
Minitabでモデルができたので、予測できます。Minitabに個々の値を入力して予測するか、一度により多く予測するのが良い場合は、値の列を入力して予測できます。
485,000ドルの住宅ローンを申請した個人について、以下のデータがあります。
- 43歳
- 年収81,000ドル
- クレジットソース9つ
- クレジットに対する負債の比率0.68
- 収入に対する負債の比率0.73
- 住宅ローン
- 北西地区
- 扶養家族なし
この値を予測モデルに入力して、以下の予測出力の通り、この人物の返済不履行の確率を取得します。この人物の住宅ローン返済不履行確率は97%以上です。予測を取得したら、あとは業界の知識を駆使して予測を解釈し、それに基づいて行動することができます。返済不履行の確率が97%の個人は、住宅ローン申請を却下される可能性が高いでしょう。
すべての予測変数の値がそろっているときに予測を行うことが最良のシナリオですが、現実的には、予測変数の一部の値が欠落していることがよくあります。Minitabの予測分析では、そのような場合でも簡単に予測を行うことができます。以下の例では、欠損値が複数あります。欠損値があっても、この顧客が住宅ローンの返済不履行を起こす確率の予測を取得できます。
375,000ドルの住宅ローンを申請した、別の見込み顧客がいます。この顧客の年収、収入に対する負債の比率、地区、扶養家族の人数に関するデータはありません。以下の情報はあります。
- 49歳
- クレジットソース4つ
- クレジットに対する負債の比率0.31
- 住宅ローン
欠損値があるものの予測は可能で、以下のように、この顧客が住宅ローンの返済不履行を起こす可能性は1%未満であることがわかります。
この分析と予測モデルに基づき、この個人は返済不履行確率が1%未満であるため、住宅ローンの有力候補であるように見えます。以上、Minitabの木ベースの機械学習アルゴリズムで複雑な問題に取り組み、価値ある洞察を得る方法のほんの一例でした。
Minitab予測分析モジュールの力をご自分の業界に応用する方法をご覧ください