Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

確率の問題

前からネット上で出回っているらしい確率の問題。某大学の試験問題?だったとか。

-------------------------------------
ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し、
表を見ないで箱の中にしまった。
そして、残りのカードをよく切ってから3枚抜き出したところ、
3枚ともダイアであった。

このとき、箱の中のカードがダイヤである確率はいくらか。
-------------------------------------

1/4だって回答が多いらしいですが、「このとき」と言われたら10/49としか思えない。
残りのカードについて一部または全部の事実が判明すれば可能性の確からしさは変わるような……
ネット上で見かける例を借りれば4択クイズを適当に答えると正解する確率は25%でも答えをふたつに絞ってもらうと50%になるみたいなことで。
モンティ・ホール問題を思い出しますね。


スポンサーサイト

野球の成績を得点換算で評価する

野球は比較的個人記録の充実したスポーツであると言えます。

首位打者争いや通算の安打数などプロ野球観戦と記録に関する話題は切っても切れないもの。

そんな中、成績データを利用してそれぞれの成績にはどれだけの価値があるのかということを具体的に明らかにする研究がメジャーリーグを中心として発展してきています。

例えば「打率3割、本塁打10本」の打者と「打率2割5分、本塁打30本」の打者ではチームにとってどちらが有益なのか? 差があるとしてどのくらいの差なのか? というような問題。

もちろん数字で野球の全てを語ることは決してできませんが、利用価値のある数字を選別し注意深く利用することによって上記のような問いに「ある程度」明確な答えを出すことはできます。

この記事では統計的かつ客観的に選手を評価する手法のひとつを紹介することを目指します。



*   *   *   *



私たちが知りたいのは、選手の活躍にどれだけの価値があるのか?ということです。

人の主観に任せて「あのヒットが一番大きかった」「いや、あの盗塁のほうが価値があった」と言い合うだけでは、結論は出ません。

客観的に同一の単位に置き換えた上で具体的に大きさを比較することが重要になります。そして野球の試合における価値は普通、得点という単位で表すことができます。

そこで登場する得点期待値は、野球の得点に関する統計データのひとつ。

得点期待値をまとめた表が以下のものです。


得点期待値表
アウト\走者走者無し一塁二塁三塁一・二塁一・三塁二・三塁満塁
無死0.46 0.81 1.19 1.39 1.47 1.94 1.96 2.22
一死0.24 0.50 0.67 0.98 0.94 1.12 1.56 1.64
二死0.10 0.22 0.30 0.36 0.40 0.53 0.69 0.82


これは一体何か?

一言で言うと考え得るアウトカウント・走者状況ごとに、そこから平均的に見込まれる得点数を表したのがここでいう得点期待値です。

例えばノーアウト走者なしでイニングが始まったとき、そこから1点入ることもあれば、3点入ることもあれば、0点に終わることもありますよね。平均するとそこから記録された得点は0.46だったということです。言い換えれば、一般的にはイニング開始時点では0.46点が記録されることを期待する(英語ではexpect、もしかすると「見込む」などと訳したほうがしっくりくるかもしれません)ことができます。

無死二塁という状況からは1.19点が期待され、イニング開始時点より得点が入りやすいことがわかります。

無死満塁からは普通2.22点入るということです。すごいですね。逆に二死無走者では0.10点と、さすがに望みが薄い状況であることが表れています。

ここで無死無走者(0.46)から先頭打者が出塁したとすると局面は無死一塁となり、得点期待値は0.81に跳ね上がります。

このとき、見込まれる得点数を0.46から0.81に上昇させた差分0.35は、その出塁した打者が稼いだ得点として評価することができます。チームが得られるはずの得点がそれだけ上昇したわけです。

もし無死無走者からアウトになったとすると、得点期待値は0.46から0.24に下がるため、マイナス0.22の評価となります。打者が打つかもしれないし打たないかもしれないという平均との比較なので、悪い仕事をすればマイナスの評価ということもあり得るわけですね。

要約すると、それぞれの局面について一般的にどれだけの得点が見込まれるか(得点期待値)を算出し、ある出来事が起きる前の得点期待値と起きた後の得点期待値を比較すればある出来事の得点価値を導き出すことができるということになります。

重要なのは、統計により野球の中の出来事に対し主観に頼らず重みを与えることができる、という点です。



以上が得点期待値の説明と、その使用例。



*   *   *   *



ここまでで野球の各局面それぞれに期待得点という意味での価値があり、それを利用して特定の出来事の得点価値を計れることがわかりました。

ここからの問題はそれをいかに選手の評価に利用するか?です。

ひとつの方法は、単打や二塁打といったイベントごとに価値を割り出し適用することです。

例えば無死一塁(得点期待値0.81)から単打が出て無死一・二塁(同1.47)になった場合、このときの単打の価値は0.65、同じ計算を一死の場合について行うと0.44……。このように単打で変化する得点期待値をあらゆる局面について計算していくと、単打が得点期待値に与える影響は平均的に+0.47だという結論を得ます。

つまり、シングルヒットは一般に+0.47点の価値があるということです。


この計算を単打・二塁打・三塁打・本塁打・四死球・アウトそれぞれについて行うと以下のようになります。

単打 0.47
二塁打 0.78
三塁打 1.09
本塁打 1.40
四死球 0.33
アウト -0.25

得点にとって有効な順に本塁打>三塁打>二塁打>単打>四死球>アウトとなるのは常識の通りでわかりやすいと思います。

繰り返しますが、ここで行ったのは打撃のイベントそれぞれが得点の増加に与える影響はいくらであるかの計算です。


さて、こうなれば、選手の評価に適用することは簡単です。導き出した値を選手の実際の成績に加重してやればいい、ということになります。

例として2008年のセ・リーグ首位打者内川選手に登場としてもらうこととします。

内川選手が記録した打撃の結果は以下。

単打 137
二塁打 37
三塁打 1
本塁打 14
四死球 35
アウト 311

これに加重を適用すると……

137×0.47+37×0.78+1×1.09+14×1.40+35×0.33-311×0.25=47.74

そもそもの得点期待値は標準的に見込む得点ですので、それに与えた影響が約+48ということは、普通の打者が打つ場合に比べて内川選手が打ったことによりチームの得点が48点増加したことを意味します。

少し細かい数字を追うのでわかりにくい面があるかもしれませんが、通常の安打数などは単打を1、二塁打も1、三塁打も1、本塁打も1、四死球とアウトは0……と数えているのに対してここではそれぞれに得点価値の重みを与えて数えているだけと考えることもできます。

このような評価方法はバッティングランズ(Batting Runs)という名前でこの分野では広く利用されているものです。

選手の打撃が具体的に得点数でどのくらいの価値があるのか?ということを表すことができます。

冒頭で書いた《例えば「打率3割、本塁打10本」の打者と「打率2割5分、本塁打30本」の打者ではチームにとってどちらが有益なのか?》といった問いにも、具体的に答えることが可能となります(ただし、これだけでは数字が足りないのでただ単にそのふたつを比較することはできません)。



*   *   *   *



2008年のバッティングランズ優秀者に関しては、サイトに掲載しています。
また、日本プロ野球記録統計解析試案ではバッティングランズを使った歴史的選手評価が掲載されており、プロ野球データリーグではバッティングランズに類する数字その他が近年の多くの出場選手についてまとめられています。ここまでの考えを興味深いと思われた方は是非ご覧になることをお勧めします。






----------------------------------------

という感じのを3つくらいに分けてLaBOLAベースボールにアップしようかと思っていたんですわ。
でもまぁ、これでも頑張ったつもりだけども長いしアレですね。
アトラクション的にしようと思うなら根本的に「説明する」って考えを捨てなきゃいけないように思えてきた。
普段できるだけ余計に誇張したり大事なとこを省いたりしないようにしているつもりなので(それができているかは別ですが……)なかなか難しいのかも。
要するに、面白い文章を書くのはとっても難しい。
書いてることが極端だとかそんなのどうでもいいレベルで、セイバーメトリクス的思考の面白さを体験するには『マネー・ボール』が一番だと思うのですけど、マネボ面白いよ面白いよってのだけ言い続けててもしゃあないですし何かやりたいのですが。



うーむ

この間野球SNS……今はLaBOLAベースボールか、に登録したのでせっかくだから地味なセイバー認知度アップを目指して得点期待値のブリーフィングでも書いてみようと思ったのですが、テーブルやら画像やらの表示がうまくいかないうちに時間がなくなって断念。日記作成の機能はなんか使いにくいなぁ。
んー、まぁこのブログで改めて企画としてやるんでもいいんでしょうが。


用語解説

グロッサリー的なものをサイトに追加してみました。価値があるのかはわからないけれど、一応前から置いたほうがいいかなとは思っていたし最近セイバー活動する時間が取れませんがこういうのぽつぽつ更新していくんならできるかなと。
「何故客観的な評価をする意味があるか、何故機能するか」の根本的な考え方とか含めて、伝いたいなら100回言う(……つもりでいく)べきなんだろうなと思いつつも、核心を説明する能力が足りないことを思い知らされる今日この頃です。


やばい、見れてない

開幕したんですよね。開幕戦とかごく一部は見たんですが……
どうですかね、今シーズンは。面白いんですかね。
WBCの興奮はもうしっかり冷めたんじゃないかと思うのですが、その辺は大丈夫なんでしょうか。









選手打席打率長打率 出塁率OPSBRRC27
山崎武司569 .262.497.358 .85521 5.80
セギノール350 .279.513.364 .87616 6.40
リック486 .329.453.368 .82114 5.85
中島俊哉205 .315.466.397 .8639 6.57
中村紀洋507 .269.458.335 .7938 5.12
中村真人162 .292.396.346 .7421 5.09
草野大輔321 .286.380.343 .7230 4.74
鉄平485 .277.389.341 .7300 4.71
高須洋介485 .290.360.348 .708-2 4.27
内村賢介100 .289.322.327 .650-2 3.68
小坂誠100 .237.305.318 .622-3 3.37
憲史158 .229.348.313 .661-3 3.51
渡辺直人529 .257.300.348 .648-5 4.20
横川史学153 .229.336.285 .620-6 3.14
藤井彰人213 .245.301.309 .610-8 2.71
嶋基宏275 .205.257.260 .517-19 1.84
代替選手403 .220.310.275 .585-20 2.64
合計5500 .269.391 .337.728-1 4.50

これは、なんだっけ。いつやったのかも忘れた楽天打者のプロジェクション(成績予想)。開幕前に出そうと思っていて出せなかったやつが結局色々あるわけですがせっかくだから適当に出してみる試み。一部打席数とか適当に決められていたりひどいですが。
まぁなんとか少しずつ試合のほう見ていきたいと思います。



投手評価について

投手評価の目安

これも4月入る直前に一夜漬けのような感じでダーっと書いたもの。
本当はもっと寝かせて冷静に確認してから上げようと思っていたのですが、スポーツニュースで「開幕はダルビッシュ対岩隈!」なんて言っているのを聞いて、ああなんか去年の話をその後から出すの恥ずかしい、と思ってしまい滑り込みでアップロード。
短期間で書いたわりには、自分の中では破綻していないほうなんですが。
それにしても本当、書きたいのと書けるのは違いますね。上手く文章にできなくてずっと眠ってるネタもある。
好きにやってるだけのことですから何を気にする必要もないんですけどね。自己満足の問題で。


2009年度順位予想

この時期みんなやっているし、せっかく野球のブログなんで。

セ・リーグ
1.巨人
2.阪神
3.ヤクルト
4.中日
5.広島
6.横浜

パ・リーグ
1.西武
2.オリックス
3.ロッテ
4.日本ハム
5.ソフトバンク
6.楽天

でもまぁ、その、当たらないであろう言い訳として聞いてもらえればいいのですが最近野球の解析について色々考えてはいてもその解析を実際の選手に当てはめて研究するってことをやっていないので全然適当なものです。
何か根拠がある予想だったら外れてもそれはそれで面白いんですけどね。パは特に全くわからない。そもそも去年の時点で勝率の偏差が小さすぎる。野球の特徴でもありますけど、最低と最高で勝率は45%~54%の違いしかない。楽天がAクラスに入ったとしても全然驚きません。

セイバーメトリクス的な考え・ツールを使えば高い妥当性で戦力を評価できるっていうのは確かだと思っていますが、同時にミクロの結果は運によりかなり変動し得るというのを嫌になるほど実感させられているので、セイバーメトリクス的な順位予想をしようと思うと何か板ばさみを感じてしまったり。


 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。