ヤクルト 50 %
DeNA 49 %
阪神 0 %
広島 0 %
巨人 0 %
中日 0 %

ソフトバンク 51 %
西武 35 %
オリックス 11 %
楽天 2 %
ロッテ 0 %
日本ハム 0 %

全ての数値は四捨五入されているので、合計が 100% にならないかもしれません。

アルゴリズムが固まってきました。想定以上に計算時間が延びてしまい、困っていますが、なんとか改良して実用レベルの速度にして、8月中の自動更新を目指します。


動画で言及した、新アルゴリズム(優勝決定日確率の算出に使用)での優勝確率の速報です。最近のチームの勢いについての現実的な補正が含まれています。

ヤクルト 62 %
DeNA 38 %
阪神 0 %
広島 0 %
巨人 0 %
中日 0 %

西武 61 %
ソフトバンク 21 %
オリックス 14 %
楽天 4 %
ロッテ 0 %
日本ハム 0 %

8月中に自動更新を目指します。


ソフトバンクとロッテが熾烈な優勝争いを繰り広げているパ・リーグ。

今日からの直接対決の初戦をロッテがとって一歩リードしました。

ここで、これまでの優勝確率の推移をふり返ってみましょう。

パ・リーグ優勝確率の推移

8月終盤から両チームが抜きつ抜かれつを繰り返しながら、他の4チームを引き離していきました。この瞬間はロッテが上に居ますが、推移を見ると、ロッテが頭を出すと、ソフトバンクが粘って抜き返して、ソフトバンクの方が上に居る時間が長くなっています。

時系列で見ると、ソフトバンクが有利に戦いを進めているように見えますが、ペナントレースは終了の瞬間に上に居た方が勝ちですから、今後の動向に目が離せませんね!


このような状況の時、それぞれの数字の意味を短くまとめました。

質問があれば @tsuchim まで

ソフトバンクの数字の意味

  • 現在、約75% の確率で優勝できるペースです
  • 残り18試合を 10勝8敗で行けば、95%の確率(ほぼ自力)で優勝できそうです
    • 10勝できなくても(確率は下がりますが)優勝の可能性は十分あります
      • 10勝しても優勝できない可能性もあります
    • マジックが点灯すれば、それを消化すれば100%優勝が決まります
      • 豪華版には、マジック点灯前でも「100%優勝決定勝利数」を掲載しています
  • 期待順位も 1.3 と、1位にかなり近いですが、油断はなりません

ロッテの数字の意味

  • 現在、約25%の確率で優勝できるペースです
  • 残り19試合を 16勝3敗で行けば、95%の確率(ほぼ自力)で優勝できそうです
    • ただ、残り19試合を、16勝3敗ペースで勝てる可能性は高くありません
    • それでも、ソフトバンクがこれから大連敗するかもしれませんし、その他のシナリオを3億通り考慮して全部足した数字が「25%」です
    • 4敗以上しても(かなり低くなりますが)優勝確率が残ることもあります
    • (おそらく)16勝の内訳として上位戦は落とせません
  • 期待順位は 1.8 と、2位に近いところ、やや1位寄りに居ます

楽天の数字の意味

  • 現在、約0%の確率で優勝できるペースです
    • 値は四捨五入されているので、完全にゼロではありません
    • 諦める必要はありませんが、相当に厳しいです
  • 優勝までが「-」なっています。残りを全勝しても、他のチームが相当都合の良いバランスで負けてくれないと優勝できません。
  • 期待順位は 3.4 と、西武よりは3位に近いけど、全く油断はできない位置です

共通すること

  • これらの数字は「予想」ではなく、現状の勝敗ペースを確率という数字で表したものです。皆さんの「予想」の材料の一つとしてお役立て下さい。
  • これまでの対戦成績を維持すると仮定して、確率的な揺らぎも考慮して、これからの対戦が考慮されています。偶然と必然の割合を(統計理論に従って)変えながら、3億通りのシナリオを計算し、最終順位の割合を確率で表示しています。
  • 故障者が出たり、日程が過密だったりするなど「これまでのペース」が維持できそうにない状況になれば、それを皆さんが加味して予想して下さい。


当サイトで計算している「優勝確率」は、「○% の確率で優勝します(しません)」という「予想」や「未来予知」ではありません。もちろん「確定的事実」でもありません。

「現在、○% の確率で優勝するペースです」という「現在の状態」を「確率という形で表現したもの」です。現在の「勝率」や「ゲーム差」と合わせて、どのぐらい優勝に近い位置に居るかという現状把握にお使い下さい。

それらを合わせて、選手やチームの状態などを考慮して、総合的に「優勝を予想」するのは、ファンの皆さんそれぞれの楽しみの範疇です。予想の材料の一つとして加えていただければと思います。


適切な例えが思いつかないのですが、天気予報も、現在の気圧配置や気温・湿度、気象衛星からの画像などを元に「現状を把握」して、これまでの経験則から「今現在予測される、明日の天気」を計算します。「今のところ、明日の降水確率は○%」という数字が発表されます。

「現状」がよほど極端な時、例えば目前に台風が迫っているようなときには、ほぼ確定的な大雨警報が出ますが、それでも、警報が出た地域全てで大雨が降るとは限りません。それでも、気象予報は人命や経済を守るために必要なので、多くの予算をかけ、たくさんの頭脳と情報を集め、精度の高い予報を出しています。

一方、この「優勝確率」は、天気予報に比べればとても単純な統計モデルを用いていますし、用いているデータにも限りがあります。天気予報でも、一週間後の天気はなかなか予測できないのに、この優勝確率が、何ヶ月も先の結果を正確に言い当てることはできません(そもそも「言い当てる」計算ではありません)。

それでも、週間天気予報や長期予報を、災害への備えや休暇の過ごし方の計画に役立てられる人が居るように、この優勝確率も、その性質を分かっている皆さんの応援の役に立てて貰えればと思います。特に、優勝決定日確率は、遠征計画のお役に立てればと思って計算を始めました。


なお、その「優勝決定日確率」ですが、10%ぐらいの値でも「この日が一番確率が高い」事を過大評価される方も多いように感じています。その日が一番確率が高いとしても、確率が10%なら、90%はその日ではない事を忘れないで下さい。

また、個人的に感じる傾向として、早期の確率分布からは、実際の優勝決定日が「若干後ろにずれ気味」になります。理由の一つに雨天順延による日程の変更がありますが、もっと大きな要因は、優勝が決定的になる時というのは、だいたい勝ちが続いた時になります。その後、そのペースが少し落ちたり、優勝目前で足踏みする事があれば「それまでのペース」よりも若干優勝が遠ざかり、決定日が後ろにずれます。

もちろん、シーズンによっては、マジック点灯からほぼ最短で勝ち進むこともありますので、毎回後ろにずれるわけではありません。こうしたばらつきのうち、統計モデルで説明できるものは織り込んでいますが、このままのペースが続きそうか、ペースが上がりそうか、下がりそうかは、皆さんで判断して下さい。その上で参考になれば嬉しいです。

当サイトの情報は「限られたデータを元に計算された現状」ですので、その他の要因もあわせて、皆さんの「予想」の材料の一つとしてお楽しみ下さい。



2010年のパ・リーグと言えば、残り6試合で首位を走っていた西武が、3.5ゲーム差で追いかけるソフトバンクに土壇場で3連敗し、その勢いでソフトバンクが優勝した大逆転がありました。

2010年9月16日、3連戦直前の優勝確率を計算してみると、
西武 96.4%、ソフトバンク 3.3%、ロッテ 0.3%
と、西武が優勝濃厚ながら、ソフトバンクにも 3.3%の逆転のチャンスが残っていたようです。2010年のこれまでの直接対決は、西武が14勝7敗と大きく勝ち越していたので、優勝の確率も大きくなっています。しかし、実際は、最終盤にソフトバンクに3連敗し、0.5ゲーム差に詰められてしまいます。

この天王山3連敗は、その後、西武ファンの悪夢として語り継がれるわけですが、3連敗した直後の優勝確率を見てみると、
西武 55.1%、ソフトバンク 44.6%
と、まだまだ西武が若干優勢だったので、むしろ、その後の 3~4試合に残された 55%のチャンスも掴めなかった事の方が痛手だったかもしれません。

優勝争いの最終盤に他力(他の4チームの働き)が大きく左右することは多くあるので、マジックの点灯や消滅、自力の消滅など、「自力」に少しこだわりすぎているのではないかな、と思います。

さらに、この年は3位に滑り込んだロッテがクライマックスシリーズで下剋上を起こして日本一となるなど、終盤に波乱が待ち受ける1年でした。

余談ですが、日本シリーズが「両リーグの優勝チーム同士の決戦」じゃなくなったのなら、呼び方も変えて「クライマックスファイナル」にして、リーグ内クライマックスシリーズは、それぞれ 1st, 2nd ステージと呼んだ方が良いのでは? と思ったりしてます。

長いペナントレース、最後まで何が起こるか分かりませんね。



2019年9月、ソフトバンクに西武が猛追を見せています。優勝確率を見ると、ソフトバンクが踏ん張りきった印象ですが、ここで補足させてください。

ここで使われている計算モデルには2種類あります。2008年頃から使っている旧エンジンと、2016年から開発を始めた新エンジンです。

新エンジンは、旧エンジンの「チームごとの相性」に加え、「球場との相性」や「最近の勢い」を考慮した計算モデルになっています。その代わり、計算速度がとても遅く、新エンジンを使って確率順位を出そうとすると、とても時間がかかるので、全部を切り替えるには至っていません。(短時間で計算しようとすると、確率の小さいシナリオが考慮されない)

メインの順位確率には旧エンジンを、優勝決定日確率には新エンジンを使っています。この違いから、現在、優勝決定日確率を全て足すと西武の方がソフトバンクより確率が高い(執筆時点)のに、順位確率ではソフトバンクの方がかなり有利という数字が出ています。

これはどちらが正しいというわけではなく、計算の手法の違いによるものですが、やはり新エンジンの方が終盤の展開を再現するのに良いモデルだと思って開発しておりますので、終盤の優勝争いの確率を把握するには、優勝決定日確率の方もあわせて参考にして頂ければと思います。

「最近の勢い」を考慮することで、長いシーズンで大きくメンバーが入れ替わったチームなどの序盤の成績が反映されにくくなります。また、直近で連勝しているチームを大きく評価します。ただ、(ご存じのように)野球では、大連勝から大連敗に転じることもままあり「勢い」を考慮すると、確率の乱高下を招きます。その点は旧エンジンの方が安定しています。一長一短です。

これらの開発には、サポータの方より援助を頂いております。心よりのご支援を結果にして還元できるよう、改良を続けて参ります。


ソフトバンクがなかなか優勝確率を上げられないでいる間に、西武が勝ちを重ねて追い上げてきました。

8/29 終了時点での2チームの優勝確率は、
ソフトバンク 74.1%、西武 22.6%

8/30 からの3連戦の結果で、優勝確率がどのように変わるか、仮定の計算してみましょう。

Continue reading