Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

MLV

また横文字の指標を並べてどうすんだ、という感じはいたしますが、Marginal Lineup Value (MLV)というやつをちょっと紹介したいと思います。
リプレイスメント・レベル概論で紹介したVORP(打者)において、元々その計算に利用されていたのがMLVです。

端的に言うとMLVは「リーグの平均的な打線に対象の打者が加わった場合チームの得点がどれだけ増えるか」ということを評価する指標です。
計算方法の実態はRCの派生商品という感じで、RCのメソッドを前提として個人への歪の小さい評価を行おうとするもの。

セイバーメトリクスに詳しい人にはよくわかる話だと思いますが、RCはBasic Versionにおいても、チームの打撃成績からチームの総得点を予測するという役割では非常に優れた働きをします。
しかし、RCをそのまま打者個人個人へ適用すると(すなわち打者の長打率に出塁率を掛ける単純な計算で評価すると)、成績の偏りが大きくなるためどうしても何らかの方向にバイアスがかかった結果を出してしまいがちになる。
だったら打者個人を平均的な打線に混ぜた場合のチーム得点で評価することでこの問題に対処しよう、というようにして生まれたのがMLVです。RC自体、現在では上記の問題に対処するような補正を含んではいますが、これから見るようにちょっと違いがあります。

具体的な計算式ですが、これがちょっと面倒臭い(ように見える)。
RCの基礎版「得点=出塁率×塁打」を使って、まずは対象の打者を含まない平均的な打線の得点数を計算し、それから対象の打者を1/9として加えた打線の得点数を計算し、両者を比較する、というものです。
いちいち漢字にしませんが、指標の前に L_ とあれば「リーグ平均の~」 T_ とあれば「チームの~」 P_ とあったら「対象選手の~」という感じで参照先を見分けて下さい。
OBPとかSLGとか書かれると馴染みがないから嫌だという方もおられるかもしれませんが、その辺は単なる記号ですので。




・対象選手なしのチーム成績

Team AVG T_AVG =L_AVG

Team OBP T_OBP =L_OBP

Team SLG T_SLG =L_SLG

Team PA's T_PA =162*25.5/(1-T_OBP)

Team AB's T_AB =T_PA*(1-T_OBP)/(1-T_AVG)

Team Runs T_RUNS =T_OBP*T_SLG*T_AB




・対象選手を含めたチーム成績

Team OBP TP_OBP =(8*L_OBP + P_OBP)/9

Team PA's TP_PA =162*25.5/(1-TP_OBP)

PA's per player TP_PA_EACH =TP_PA/9

AB's per other players TP_AB_EACH =TP_PA_EACH*(1-L_OBP)/(1-L_AVG)

AB's for our player TP_AB_HIS =TP_PA_EACH*(1-P_OBP)/(1-P_AVG)

Team AB TP_AB =8*TP_AB_EACH+TP_AB_HIS

Team SLG TP_SLG =(8*L_SLG*TP_AB_EACH + P_SLG*TP_AB_HIS) / TP_AB

Team Runs TP_RUNS =TP_OBP*TP_SLG*TP_AB


・シーズン単位でのMLV(対象打者が入ることによって増える得点数)

Marginal Value/Season MLV_FULL =TP_RUNS - T_RUNS



最終的な数字としてはRCAAなどでお馴染みの「リーグ平均をゼロとする」形で出てきます。値がプラスなら平均より優れていて、マイナスなら平均以下の打者。
MLVが20であれば、その打者を1年間使い続けた場合平均的な環境ではチームの得点が平均的な打者が打つ場合に比べて20増えるという意味。
なお、上記の計算では年間の試合数が162、試合あたりのアウト数が25.5に固定されています。これは状況に応じて変えればいい数字です。
対象の打者が実際にどれだけ出場したかとは関係なく、打率や出塁率や長打率のようにレートスタッツとして出力されています。

実際にどれだけ出場したかを勘定に入れるには、チームの打席数に対する選手の打席数の割合を計算して、以下のように計算します。

PA% = Player's PA / Actual team's PA
MLV = (PA% / 11.1%) * MLV_FULL



式の中身はひとつひとつ説明するとただただ冗長になるだけですので特に細かい説明はしませんが
RCを知ってさえいれば内容は明快です。打者の質の評価に使われるのは打率・出塁率・長打率だけ。
RCが「何故か」打数というユニットを必要としていたりするので若干式は面倒です。
とはいえ、対象の打者が加わった打線というのは要するに打者のパフォーマンスを1/9として、残り(8/9)を標準的なパフォーマンスとして加重平均してRCを計算しちゃいましょうという話で、特に難しく解釈しようもありません(打順を考慮するときっかり1/9にされるのもどうかという話にはなりますが、それはまぁ色んな打順に入って平均化されると仮定して、ぐらいでゆるく捉えておいて問題はないでしょう)。

さて、MLVの美点は何か。
それは、特定の打者がチームに入ったときに生まれる効果のインタラクティヴ性を評価するところ、特に対象打者の出塁率によってチームの打席数が増減することを考慮に入れているところです。
この点は単純に実際の打席数だけで評価すると見落としがちです。
例えば打席あたりのXRが同じでも、出塁率が高い打者のほうがアウトを生まないためチームに新たな得点機会(打席)を提供し、ごく微弱には自らの打席数も増えます。これは論理的には明らかなので、対象の打者の影響をちゃんと測ろうとするならできれば反映させたいところ。でもXR+などでは直接は計測されません。
この意味において、理念的にはMLVは打席あたりXRなどよりも適切であると考えられます。
要はMLVの紹介で言いたかったのはこの点なんです。
(ただし、そのことを計算に入れたからといって、数字に大きな変化があるわけではありません)

MLVの問題点は「欠陥のある」RCに基づいていることです。今のところRCは得点推定式として最良の選択肢ではない(と、少なくともセイバーメトリシャンの間では言われている)。
しかしMLVの発想自体は得点推定式のモデルそのものとは別個に存在し得るもので、前提からの論理展開の部分、すなわち「話の筋」はよくわかります。構造的に優れているわけです。
現段階で例えばBsRを使用する式に書き換えるようなことも可能ですが、BsRだって新たなモデルに取って代わられる可能性もあり、この問題はMLVそのものの本質的な性格とは分けることができます(MLVの計算に好きな得点推定式を使うことは許されるでしょうが、その発想の性質を活かすためにはRCのようにダイナミックスなモデルであるべきです)。
ちなみにこのMLVで、同じ打席数の割合で同じ守備位置・リプレイスメントレベルのMLVと比較する計算を行えばVORPになるということです。




参考

MLVの説明(英語)
Keith Woolner, "Marginal Lineup Value"
RCのモデルに関して(拙サイト)
『偉大なるRuns Created』

コメント

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/447-d3c0b275

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ