Minitabブログ

Minitab Solution Centerを使って次のNCAAチャンピオンを予測する

作成者: Cheryl Pammer|2025/11/17 5:00:00

データは、シーズンが終わる前に誰がNCAAトロフィーを持ち帰るのかを本当に予測できるのでしょうか?

ネタバレ:可能であり、実際にそうしてきました。

 

必要な理由

Minitab本社とペンシルベニア州立大学があるペンシルベニア州ステートカレッジでは、秋と言えばフットボールです。

空気が冷え、プレーオフレースをかけた争いが激化すると、数字を分析して最も重要なときにどのチームのパフォーマンスが「崩れない」かを見るのに最適な時期です。

 

適切なデータを見つける

2025年の全国チャンピオンを予測するために、プリンストンがグリッドアイアンを支配した1869年まで遡る統計の宝庫(本当の話です)、sports-reference.comからデータを引き出しました。

しかし、現代では大学フットボールは大きく変わってきています。そのため、埃っぽい歴史を掘り起こすのではなく、2014年に始まったカレッジフットボールプレイオフ(CFP)時代に焦点を当てました。

面白い事実:2014年以来、全国チャンピオンが11月の最終AP投票で5位以下にランクされたことはありません。
解釈:11月までに、真の候補はすでに見込まれているというわけです。

この洞察をもとに、トップ10チームだけに集中し、候補外のチームからの雑音は取り除きました。

 

XとYのモデル化

目標:各トップ10チームが優勝する確率を予測すること。

Logistic RegressionRandom ForestsTreeNetなどの分類モデルを使用して、スプレッドシートを使ってMinitabにフットボールコーチのように考えるようにトレーニングしました。

モデルの内容は次のとおりです。

  • OSRSとDSRS:オフェンシブおよびディフェンシブシンプルレーティングシステム - スケジュールの困難度に合わせて効率を調整。
  • オフェンスとディフェンスの得点:良い点と悪い点。
  • パス効率とランニング効率:両サイドのボールのバランスと適応性。
  • 総合攻撃と総合守備:ヤード数に基づくパフォーマンス。
  • SRS:攻撃と守備を組み合わせた総合力。
  • 勝敗記録:一貫性の究極の尺度。

要するに、チャンピオンと9月にただ良く見えただけのチームとを区別する全ての要素です。

 

データの準備

2014年から2024年までの統計をエクスポートし、クリーニングと準備のためにMinitab Data Centerから送信しました。Minitab AIにより、ほとんどのクリーンアップは自然言語を通して行われ、反復的手順を節約し自動化する機能が実現し、以前は時間がかかっていた作業が、今ではスムーズに進行します。

正直に言って、10年分のフットボールデータを手作業でクリーンアップしたい人はいません。

モデルの構築

データの準備ができたら、Minitab Statistical Softwareにスタックし、以下を使用しました。

Automated Machine Learning(自動機械学習) > Discover Best Model(最適なモデルの検出)(バイナリーレスポンス)

これは、複数のモデルを迅速にテストし、最も得点の高いモデルを特定するMinitabの予測分析ソリューションです。

勝者は? Random Forestです。

「勝者」対「敗者」の最も正確な予測が提供されました。

 

主な洞察

Random Forestモデルは、チャンピオンシップにおける成功の4つの最大予測因子を明らかにしました。

  1. 勝敗記録
  2. 守備力(DSRS)
  3. 総合力(SRS)
  4. スコアリングディフェンス

要点:守備が依然としてチャンピオンシップを勝ち取ります - これは、コーチだけでなくデータによって確認されています。

 

2025年の予測

それでは発表します...

トップ10チームの2025年のシーズン途中の統計を使用して、各チームがタイトルを獲得する確率を計算し、合計が100%になるように結果を標準化しました。

2025年11月5日現在、このモデルの予測は以下の通りです。

Ohio StateIndianaには、全国タイトル獲得の最も大きいチャンスがあります。

Big Tenにとっても状況は悪くありません。Georgiaは残念ながら、今年は良い年ではないようです。

 

レースの視覚化

結果の追跡を簡単にするため、インタラクティブなMinitab Dashboardを構築しました。

Minitab AIを使用すれば、データソースを接続するのと同じくらい簡単です。チャート、表、モデルの結果が自動的に1つのダイナミックビューにまとめられます。

これは、マスコットヘッドのない自分バージョンのESPNのCollege GameDayのようなものです。

ダッシュボードは新しいデータが入ってくると自動的に更新されるので、どのチームが成績を上げているか、後れを取っているかがすぐに確認できます。これは、チャンピオンシップレースを追うリアルタイムのデータ駆動型方法です。

 

データが示すこと

  • 守備が依然としてチャンピオンシップを勝ち取ります。それは、チャンピオンと挑戦者の間の最も強力な差別化要因です。
  • 効率が成功の鍵です。バランスが試合の勝利、タイトル獲得につながります。
  • 一貫性が重要です。複数の敗北を抱えるチームがトロフィーを掲げることはめったにありません。
  • 攻撃は助けになりますが、偉大さを定義するのは守備です。
  • データは直感よりも確実です。Minitabの予測分析モジュールは、混乱を明確さに変えます。

要するに、推測は不要になります。今すぐモデリングを始めましょう。

 

おわりに

この分析は、サッカーファンが既に知っていることを証明しています。チャンピオンシップは誇大宣伝や見出しで決められるものではありません。

現場でもビジネスでも、チャンピオンシップを獲得するのは守備、規律、データです。

独自のデータストーリーを見つけたいですか? Minitabで一緒にモデル化しましょう