Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

WARにおけるリリーフ評価の問題

せっかくなので、リリーフについてもう少し続けます。

『セイバーメトリクス・リポート2』に寄稿した記事「リリーフの本質・評価・最適配置」ではタイトル通りリリーフの本質と評価と最適配置について論じたわけですが、当該論文ではリリーフの問題を掘り下げるということが主眼だったので、現行の選手評価体系であるWARにおけるリリーフ投手の扱い、という観点は深堀できませんでした。

しかし「評価」を論じる中でWARについての疑問も出てきたため、ここでその点を掘り下げてみたいと思います。

この点について最も気になったのは、WARにおいて、リリーフだけが活躍の状況を評価に取り込んでしまっているということでした。個人的には、これを「リリーフの評価だけ三次元になっている」と整理していますが、いきなりそう言ってもわかりにくいので順を追って述べていきます。

WARは基本的に、選手個々人を独立して公平に評価するという思想の上に成り立っています。ある選手がヒットを打ったとき、たまたま塁上にランナーがいたから点になって評価が上がる、あるいは逆にランナーがいなかったら評価が下がる、というのは個人評価としては公平でないと考えます。打席に入る前にランナーが出るかどうかはその選手の働きではないからです。

この結果出てくるのが局面に見込まれる平均的な得点(得点期待値)を評価に使うという手法(LWTS)で、これはいわば選手のすべてのプレーを仮想的に「平均的な状況で発生した」ものとみなして評価を行うことに等しくなります。

ということは評価を考える上でプレーが実際にどの状況で発生したのかということは考慮しなくてよいことになります。結局、選手の評価は機会あたりのプレーの質と機会の多さの掛け算で決まります。機会あたりの質というのは打者であればwOBA、投手であればFIPであり、機会というのは打席や投球回ですね。すなわち、打者ならwOBAが高くて打席数が多ければたくさん貢献したと評価されるという単純な話です。

しかしリリーフ投手については、このような評価だけでは問題があるのではないかという考え方があり得ます。ひとつ前のブログ記事でも言及したように、リリーフ起用という方策はそもそも「できるだけいい投手をいっぱい投げさせよう」という単線的な発想から脱して、あえて登板機会を抑えてでも大事な局面に良い投手を投げさせようという発想のものですから、実際の局面を無視して平均化するというLWTSの評価方式はリリーフのそもそもの本質を描写するのに向いていないことになります。

そこで出てくるのが局面の重要度を客観的に測定したレバレッジ・インデックスという指標を救援投手の貢献値に掛け合わせるという手法で、こうすれば重要な局面で抑えるというリリーフの働きを計数的に描写できるよね、ということで現在これがWARにおいて採用されています(※FanGraphsやBaseball-Referenceでは採用されていますが、『セイバーメトリクス・リポート2』掲載のWARではレバレッジは使われていません)。

これでめでたしめでたしとなればいいのですが、こうしてざっとまとめてみるとすぐにわかるように、そもそも局面を考慮すると不公平になるから無視することにしたのに、リリーフの評価を考える中でまた局面の要素を取り込んでしまい不公平が復活したではないかという問題があります。

実際、同じように優秀なピッチングをするリリーフ投手が二人いたとして、片方はレバレッジ・インデックスが高い局面で、他方は低い局面で起用されれば、与えられた登板機会の中でベストを尽くすという仕事については同一でもWARの計算上は前者の方が評価は高くなります。

ここで冒頭に述べた「リリーフだけ三次元」の意味が明確になってくるかと思います。打者と先発投手は「質×量」なのに救援投手は「質×量×局面(レバレッジ)」になっているということです。レバレッジの高さが奪三振の多さのように選手の力量で決まるものならいいのですが、そうではなく恣意的に与えられるだけのものである点に問題があります。


war_evaluation


リリーフの本質を踏まえるとレバレッジを取り入れることは非常に大切なのですが、あくまでも公平な個人評価という観点で考えるならば、レバレッジを使った評価が妥当なのかには疑問が残ります。それ自体が良いとか悪いとかいうよりも、打者や先発投手の評価と比較したときにWAR内部のロジックとして整合性が取れていないのではないかと感じます。このあたり、アメリカのセイバーメトリシャンがどのように理論的な整理をつけているのかが私にはよくわかりません。広い枠組みで言えば「WARの評価体系において局面すなわちコンテクストをどのように扱うか」という問題です。

リリーフだけは例外だ、とか、打者や先発投手にもレバレッジに相当する局面の要素を掛けてもいいけど実際には平均化されてあまり影響がないから省略しているのだ、とか、考え方は色々あり得ると思うのですが、今のところその辺がよくわからないというのが議論として俎上に載せたい点です。

なお個人的な考えとしてもはっきりした答えは出せておらず「レバレッジ・インデックスを使ったやり方はうまいやり方だとは思うけれど、整合性が取れていないと言えばそうだし、WARの基礎をなしているLWTSの原理との食い合わせも良くはない」と感じるのが率直なところです。

ただ個人的な意見としてひとつあるのは、究極的には解決策になるわけではないものの、上記のような問題がある以上それがわかるようなWARの見せ方にしたほうがいいのではないかということです。

救援投手のWARが例えば1.6だといきなり言われても、それは投球が優れていたのか、そうではないけどレバレッジの高い局面で投げたのかがわかりません。仮にレバレッジを考慮しないで計算したWARが1.2で、レバレッジが1.33であるために1.6になっているなら、0.4は局面によるボーナスの要素があるため、それがわかるように分けて表示すべきではないかと。

この分離が明確だと、優秀な投手にレバレッジの高い局面を割り当てることに成功しているかどうかも一目瞭然となり、素のWARとレバレッジの相関度でベンチの投手起用の的確さを評価するという視点にもつながってくると思います。個人的にはFanGraphsが採用しているFIPとFDPの両建てよりも、ここを明確にするほうがリリーフについては重要なのではないかと感じます(Baseball Referenceでは分離した形で見れます)。もっとも、リリーフエースでもない限りレバレッジによってそこまで強烈に数値が左右されるものでもないとは思いますが。

あと、局面要素補正前のWARに掛け合わせるのが具体的な数値としてレバレッジ・インデックス(ポテンシャルとしての勝率の変動の大きさの指数であって一点の重さを直接に計測しているわけではない)でいいのかというのも自分の中ではまだ吟味できていないのですが、このあたりは向こうのセイバーメトリシャンにとっては自明なのでしょうかね。



コメント

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/548-dcebc8ae

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。