Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

野球の成績を得点換算で評価する

野球は比較的個人記録の充実したスポーツであると言えます。

首位打者争いや通算の安打数などプロ野球観戦と記録に関する話題は切っても切れないもの。

そんな中、成績データを利用してそれぞれの成績にはどれだけの価値があるのかということを具体的に明らかにする研究がメジャーリーグを中心として発展してきています。

例えば「打率3割、本塁打10本」の打者と「打率2割5分、本塁打30本」の打者ではチームにとってどちらが有益なのか? 差があるとしてどのくらいの差なのか? というような問題。

もちろん数字で野球の全てを語ることは決してできませんが、利用価値のある数字を選別し注意深く利用することによって上記のような問いに「ある程度」明確な答えを出すことはできます。

この記事では統計的かつ客観的に選手を評価する手法のひとつを紹介することを目指します。



*   *   *   *



私たちが知りたいのは、選手の活躍にどれだけの価値があるのか?ということです。

人の主観に任せて「あのヒットが一番大きかった」「いや、あの盗塁のほうが価値があった」と言い合うだけでは、結論は出ません。

客観的に同一の単位に置き換えた上で具体的に大きさを比較することが重要になります。そして野球の試合における価値は普通、得点という単位で表すことができます。

そこで登場する得点期待値は、野球の得点に関する統計データのひとつ。

得点期待値をまとめた表が以下のものです。


得点期待値表
アウト\走者走者無し一塁二塁三塁一・二塁一・三塁二・三塁満塁
無死0.46 0.81 1.19 1.39 1.47 1.94 1.96 2.22
一死0.24 0.50 0.67 0.98 0.94 1.12 1.56 1.64
二死0.10 0.22 0.30 0.36 0.40 0.53 0.69 0.82


これは一体何か?

一言で言うと考え得るアウトカウント・走者状況ごとに、そこから平均的に見込まれる得点数を表したのがここでいう得点期待値です。

例えばノーアウト走者なしでイニングが始まったとき、そこから1点入ることもあれば、3点入ることもあれば、0点に終わることもありますよね。平均するとそこから記録された得点は0.46だったということです。言い換えれば、一般的にはイニング開始時点では0.46点が記録されることを期待する(英語ではexpect、もしかすると「見込む」などと訳したほうがしっくりくるかもしれません)ことができます。

無死二塁という状況からは1.19点が期待され、イニング開始時点より得点が入りやすいことがわかります。

無死満塁からは普通2.22点入るということです。すごいですね。逆に二死無走者では0.10点と、さすがに望みが薄い状況であることが表れています。

ここで無死無走者(0.46)から先頭打者が出塁したとすると局面は無死一塁となり、得点期待値は0.81に跳ね上がります。

このとき、見込まれる得点数を0.46から0.81に上昇させた差分0.35は、その出塁した打者が稼いだ得点として評価することができます。チームが得られるはずの得点がそれだけ上昇したわけです。

もし無死無走者からアウトになったとすると、得点期待値は0.46から0.24に下がるため、マイナス0.22の評価となります。打者が打つかもしれないし打たないかもしれないという平均との比較なので、悪い仕事をすればマイナスの評価ということもあり得るわけですね。

要約すると、それぞれの局面について一般的にどれだけの得点が見込まれるか(得点期待値)を算出し、ある出来事が起きる前の得点期待値と起きた後の得点期待値を比較すればある出来事の得点価値を導き出すことができるということになります。

重要なのは、統計により野球の中の出来事に対し主観に頼らず重みを与えることができる、という点です。



以上が得点期待値の説明と、その使用例。



*   *   *   *



ここまでで野球の各局面それぞれに期待得点という意味での価値があり、それを利用して特定の出来事の得点価値を計れることがわかりました。

ここからの問題はそれをいかに選手の評価に利用するか?です。

ひとつの方法は、単打や二塁打といったイベントごとに価値を割り出し適用することです。

例えば無死一塁(得点期待値0.81)から単打が出て無死一・二塁(同1.47)になった場合、このときの単打の価値は0.65、同じ計算を一死の場合について行うと0.44……。このように単打で変化する得点期待値をあらゆる局面について計算していくと、単打が得点期待値に与える影響は平均的に+0.47だという結論を得ます。

つまり、シングルヒットは一般に+0.47点の価値があるということです。


この計算を単打・二塁打・三塁打・本塁打・四死球・アウトそれぞれについて行うと以下のようになります。

単打 0.47
二塁打 0.78
三塁打 1.09
本塁打 1.40
四死球 0.33
アウト -0.25

得点にとって有効な順に本塁打>三塁打>二塁打>単打>四死球>アウトとなるのは常識の通りでわかりやすいと思います。

繰り返しますが、ここで行ったのは打撃のイベントそれぞれが得点の増加に与える影響はいくらであるかの計算です。


さて、こうなれば、選手の評価に適用することは簡単です。導き出した値を選手の実際の成績に加重してやればいい、ということになります。

例として2008年のセ・リーグ首位打者内川選手に登場としてもらうこととします。

内川選手が記録した打撃の結果は以下。

単打 137
二塁打 37
三塁打 1
本塁打 14
四死球 35
アウト 311

これに加重を適用すると……

137×0.47+37×0.78+1×1.09+14×1.40+35×0.33-311×0.25=47.74

そもそもの得点期待値は標準的に見込む得点ですので、それに与えた影響が約+48ということは、普通の打者が打つ場合に比べて内川選手が打ったことによりチームの得点が48点増加したことを意味します。

少し細かい数字を追うのでわかりにくい面があるかもしれませんが、通常の安打数などは単打を1、二塁打も1、三塁打も1、本塁打も1、四死球とアウトは0……と数えているのに対してここではそれぞれに得点価値の重みを与えて数えているだけと考えることもできます。

このような評価方法はバッティングランズ(Batting Runs)という名前でこの分野では広く利用されているものです。

選手の打撃が具体的に得点数でどのくらいの価値があるのか?ということを表すことができます。

冒頭で書いた《例えば「打率3割、本塁打10本」の打者と「打率2割5分、本塁打30本」の打者ではチームにとってどちらが有益なのか?》といった問いにも、具体的に答えることが可能となります(ただし、これだけでは数字が足りないのでただ単にそのふたつを比較することはできません)。



*   *   *   *



2008年のバッティングランズ優秀者に関しては、サイトに掲載しています。
また、日本プロ野球記録統計解析試案ではバッティングランズを使った歴史的選手評価が掲載されており、プロ野球データリーグではバッティングランズに類する数字その他が近年の多くの出場選手についてまとめられています。ここまでの考えを興味深いと思われた方は是非ご覧になることをお勧めします。






----------------------------------------

という感じのを3つくらいに分けてLaBOLAベースボールにアップしようかと思っていたんですわ。
でもまぁ、これでも頑張ったつもりだけども長いしアレですね。
アトラクション的にしようと思うなら根本的に「説明する」って考えを捨てなきゃいけないように思えてきた。
普段できるだけ余計に誇張したり大事なとこを省いたりしないようにしているつもりなので(それができているかは別ですが……)なかなか難しいのかも。
要するに、面白い文章を書くのはとっても難しい。
書いてることが極端だとかそんなのどうでもいいレベルで、セイバーメトリクス的思考の面白さを体験するには『マネー・ボール』が一番だと思うのですけど、マネボ面白いよ面白いよってのだけ言い続けててもしゃあないですし何かやりたいのですが。



コメント

こんにちは、kkkと申します。
いつも興味深くブログを拝見しています。

得点期待値のテーブルに関してですが、その統計データはどの期間(時代?)に採られたものでしょうか。

データの信頼性については特に補足等が無い様なので十分だろうとは思うのですが、少し気になったので。

時代、リーグ、国ごとの期待値表に差異があり、そこから何か考察していくというのも面白そうですね。

初めまして。

前から気になっていたんですが、
ゲイリー・シェフィールドが、イチローの記録に対して
「単打を200本打ったからといって、そんなものは偉大な打者とはいえない。本塁打を打つことに拘らなければ、自分でも毎日単打くらい打つことができる」
と発言して物議を醸したことがあるそうですが、
イチローも、
「打率2割2分でいいなら本塁打40本は打てる」

あまり厳密な話ではないですが、これってどちらが得点期待値を高めているんでしょうか?

ただ、局面によってスモール・ベースボールが有効な場合とビッグ・ベースボールが有効な場合を区別する必要があるかもしれませんね。

自軍の得点期待値を低くすることが出来る、優秀な相手投手から奪った得点はより重く評価するとか。
逆に、序盤でワンサイドゲームになってしまった場合、
例えば5回終わって10対0のスコアで勝っていたときに、終盤でさらに10点追加しようが、4・5点奪われようが、あんまり意味が無いような気がします。

>kkkさん

いつもご覧下さりありがとうございます。
よろしくお願いします。

掲載の得点期待値表ですが、これは『メジャーリーグの数理科学』に収録されている、昔のメジャーリーグのものです(小数点以下3位を省略)。
なるべく長くならないように色々と端折った文ですので補足はしていませんが信頼性が高いかは疑問だしそのままNPBに当てはめることも問題はありますね。
ただし、NPBのデータは1年分しかみたことがありませんが
MLBのものもNPBのものも、あるいは確率モデルから理論的に求めた得点期待値表でもわりと傾向は揃っているようで面白いです。
全体として見ればかなり確率論的に素直に得点が記録されているような気がします。



>Exchangeさん

はじめまして。よろしくお願いします。

机上もいいところですが、乱暴でいいなら試しに弾き出してみることはできるのではないですかね?
打数を600で揃えて安打を単打と本塁打に単純化してバッティングランズを適用すれば

600打数 200単打 0本塁打 打率.333 BR=-6
600打数 92単打 40本塁打 打率.220 BR=-17.76

となります。
個人的にシェフィールドの発言に対しては、長打なしに偉大な打者となることは極めて難しいという意味ではわかる部分があります。
ただ、これはWBCのときにも書こうかと思ったのですが、イチローはそれこそバッティングランズのようなアナライズにおいて平均より劣る打者だったことは一度もありません。それを思うとイチローのようなスタイルも軽々しく文句をつけられるべきではないと感じます。

後半で書かれていることはとても重要なことで、それをフォローするために色々な研究があるようですね。

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/332-e679a77e

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。