Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

打線シミュレーション計画 その2

・打線の勝率

前回のネタを引き続き利用していけるかなと思った話。
ある打線に見込まれる勝率をシミュレーション結果を利用して計算できるなと今更思いつきました。

得失点から理論上の勝率を導きだすメソッド自体は、例によってとっくに開発されています。
例えば「ヘンリー理論」式は以下のように実に簡潔です。

(得点の2乗)/(得点の2乗+失点の2乗)

2乗ではなく1.83とか1.81乗のほうがやや実態に即している、なんて意見も見たことがありますが結果に大きな違いはありません(この式、“ヘンリー理論”と紹介している日本のサイトが数多く見られるためそれに倣っているのですがビル・ジェイムズ考案の“野球版ピタゴラスの定理”であるという説明も見受けます。そもそもどういう由来のものなのかは不勉強にしてよくわかりません)。
具体的にチームの勝利を考える上でよく使用されるようです。
「うちのチームがせめてプレーオフに進めるだけの勝率を上げるには得点(または失点)をどの程度改善したらいいだろうか?」というような考えにはこういう式が不可欠で、ある意味XR+などもそのような勝利への絶対的な照準の上で真価を発揮するのではないかと思います。

でも、本当に全体の得点だけでそのチームが持つ勝利の可能性を的確に導けるんでしょうか?
例えば同じ平均得点でも打線によって試合ごとの得点のバラつき方が違うとしたらどうでしょう。
そこでその辺の検証がてらシミュレーションからの見込み勝率を求めてみたいと思います。
(いや、わざわざシミュレーションなんぞしなくても式の的確さはちょっと過去の結果と照らせばわかるのですが、まぁ喋らせて下さい)


シミュレーション上で2007年セリーグの平均的な野手が並んで打線を構成した場合1試合あたりの得点が4.40になることは前回書きました。
で、改めて5万試合ほど試行して調べると、試合毎得点の分布は以下のようになりました。

得点割合
07.79%
110.99%
213.12%
313.66%
412.32%
510.77%
68.93%
76.82%
84.92%
93.58%
102.48%
111.74%
121.04%
130.64%
140.49%
150.29%
160.19%
170.08%
180.05%
190.06%
20以上0.03%

この並びは「平均打線が試合をした場合13.12%の確率で2得点に終わる」というふうに見て下さい。
平均は4.40でも頻度としては3点や2点の試合が多いことがおわかりいただけるかと思います。
標準偏差は3.17ほどですね。
ここで単純に、9回を終えた時点での得点数を比較することで勝敗を決する、すなわち延長戦がないとするならば
この打線が勝つ確率は自軍得点が0点の場合はゼロ、1点の場合は相手が0点のときだけ、2点の場合は相手が1点以下の場合……というふうに求められます。当然同じ打線と対戦するならば勝率5割です。
比較対象としてまた2007青木×9の打線を引っ張ってきます。

青木打線  平均:8.34 標準偏差:4.63

得点割合
01.44%
12.87%
24.65%
36.32%
47.40%
58.39%
68.52%
78.60%
88.53%
97.55%
106.73%
115.88%
125.06%
134.04%
143.19%
152.62%
162.16%
171.55%
181.16%
190.91%
20以上2.43%

うーんと、ちょっと侮っていました。
プログラムの記述の都合もあって「20以上」はひとくくりにしていたのですが2%以上もあるとは。
まぁ、いいでしょう。

ここから計算するに青木打線が平均打線に勝つ確率は.772ほどです。
最初に紹介した予想式に同じ得失点を入れてみると.782ですから、まぁ大体同じですね。
144試合を想定してRun Per Winで予想勝利数を出すとやや大袈裟な値になるようです。


続いて2007高橋由伸打線。
総合的に青木と同じような優秀さながら本塁打に偏ったタイプとして。

高橋打線  平均:8.27 標準偏差:4.44

得点割合
01.17%
12.63%
24.40%
36.00%
47.50%
58.35%
68.85%
78.92%
88.72%
98.19%
107.08%
116.01%
125.08%
134.30%
143.38%
152.50%
161.83%
171.39%
181.08%
190.77%
20以上1.85%

対平均打線の勝率は.778になりますかね。
予想式では.779でほぼピッタリ。
気になるのは、おそらく(色んな意味で)誤差の範囲と思われる差とはいえ平均得点で勝る青木打線に比べて高い勝率だってことです。
標準偏差に表れている通り、高橋打線のほうがブレが少なく安定して高い得点を上げられるという結果です。
前述したように2007年の成績を見ると青木と高橋の打者としての大きな違いって本塁打ではないかと思うのですが
この勝率の違いが本塁打によるものだとしたら面白いです。
どうも巷では本塁打への依存度が高い攻撃というと効率が悪く安定した戦いができないものと言われるような気がしますが
結局のところ本塁打による“得点ポテンシャルを確実に顕在化させる効果”が安定した得点を導くとしたら……
少なくともバラつきが大きく不安定なようには見えません。

一応もう少し詳細なモデルを使って試してみても、勝率は青木が上になるものの標準偏差に関してはやはり同じ傾向を示します。
まだサンプルがわずかなんですが「得点のうち本塁打への依存が大きいほど試合毎の得点は安定する」という相関関係が少し。
まぁシミュレーションはシミュレーションですし、たまたまかもしれませんから、間違っても安易に「スモールボール VS ビッグボール」の結論に使えるようなものではないんですが。


平均よりやや強いぐらいの例で2007谷打線。
打率は良かったですが総合指標的にはそれほど大した貢献ではありませんでした。

谷打線  平均:4.76 標準偏差:3.33

得点割合
06.37%
19.75%
211.92%
312.73%
412.46%
511.15%
69.22%
77.34%
85.82%
94.06%
102.94%
112.08%
121.51%
130.97%
140.66%
150.41%
160.24%
170.16%
180.10%
190.04%
20以上0.09%

シミュレーション上の見込み勝率.537。予想式では.540。これもほぼ同じ。
平均が強めの想定ですが、打線が全員谷で投手陣が平均的だったとしたら優勝は難しいことを意味します。


低い得点レベルの例として2007飯原打線。
というか前回から打てない例として出すことに悪意はありませんので。たまたま成績を入力してあるから楽なだけです。

飯原打線  平均:3.05 標準偏差:2.52

得点割合
014.42%
117.17%
217.19%
315.02%
411.88%
58.60%
65.85%
73.91%
82.46%
91.48%
100.84%
110.53%
120.28%
130.17%
140.09%
150.06%
160.03%
170.00%
180.01%
190.00%
20以上0.00%

シミュレーション上の見込み勝率.360。予想式では.325。ちょっと乖離がありますかね。


まとめ+αを載せると

青木 対 平均 .772 (.782)
高橋 対 平均 .778 (.779)
飯原 対 平均 .360 (.325)
谷  対 平均 .537 (.540)
青木 対 高橋 .499 (.503)
青木 対 谷  .744 (.753)
青木 対 飯原 .863 (.881)
高橋 対 谷  .750 (.751)
高橋 対 飯原 .869 (.880)
飯原 対 谷  .326 (.291)

名前の後のがシミュレーションからで、カッコ内が予想式の勝率。
標準偏差の広がりにどのようなファクターが影響しているのかをもっと詰められれば少し面白いかもしれませんねぇ。
ただ、気になるところがあったから少し書いたものの基本的には打線ごとのバラつきの違いというのはほぼ無いようなものです。ほとんどは単に得点力の高い打線は幅も広がるというので説明できそう。打順の影響も小さいでしょう。言い換えれば、単純に総得点の多い打線は優秀な打線で、総得失点から勝敗を考えるので十分理にかなっているということです。
もし同じ得失点能力の中でのやりくりということを考えるならば打線よりも守備側、いかに投手分業を行うかの部分に選択による利得を生み出す余地があるのかもしれません。

一応このようにシミュレーション結果によって見込み勝率が求められることと、その観点からも(得点の2乗)/(得点の2乗+失点の2乗)の式はどうやらかなり的確だと言えそうだということを記します。


追記で余談:シーズンのシミュレーション
ざっとプログラムで「平均打線 対 平均打線」を140試合行わせシーズンのシミュレーションとした場合
本来勝率5割・得失点差ゼロとなるはずが勝率.550だとか.456とかになることが結構あります。
140試合毎の得失点差の標準偏差は約40点。
信頼区間の式などで見られる通り勝率で0.04ぐらいのバラつきは確率的に通常覚悟しなければならない範囲ということになります。
Aクラス・Bクラスとかって仕切りは根本的に意味のあるものだとは思いませんが同じ実力だったとしても行ったり来たりを繰り返す可能性が十分にあるので、まぁはっきり言うとシーズン単位で見ても運はそれなりの割合で入り込んでくるだろうということです(ただし、さすがに平均チームがただのまぐれで優勝だとか最下位になることはほぼ無さそうです)。
別に僕はそれを悪いことだと思うわけではありませんし
もし「お前机上の計算ごっこでなんか言ってっけど実際には様々な戦術や選手の調子、精神的な動きなんかが複雑に作用してそんなふうにはならないんだよ」というご意見を頂いたとして反論するつもりもありません。
ただ、野球における運と実力とは何かを考える上でひとつの資料にはなるのではないかと思います。




そうそう、前回の記事に道作さんから
『得点に対する標準偏差の詰まり方が予想より小さかったのが面白い』
というコメントをいただきました。
おそらく3アウト→4アウトの変化に対するコメントだと思うのですが、これは僕も同じ感想を持ちました。
もっと激的な変化が起きてくれることを期待したんですが。
むしろ5アウトなんかにすると3アウトとはまた別の「気まぐれな偏り」を招き入れるような気配すらある気がします。一筋縄ではいかないのかもしれません。
ただその辺もまだまだ実験が足りませんし僕の解釈の力も及ばない雰囲気がありますのでかなりなんとも言えないんですが。



 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。