Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

投手WARのフレームワーク


What is WAR for pitchers? (Tangotiger Blog)

TangotigerがWAR(投手)のフレームワークを一行の式で書き表しています。
こういうのは頭が整理されて面白いので、真似をしつつちょっと変えて、自分も投手WARの計算を式にしてみました。


WAR=(投球回/9)×(リプレイスメント失点率-失点率)/RPW×レバレッジ

※リプレイスメント失点率は、NPBでは平均失点率の1.3~1.4倍程度。
※RPWは通常10前後。
※レバレッジは先発投手は1.0、救援投手は役割により0.7~1.5程度。


WARはこんな感じの「フレームワーク」で、それ自体は普遍的です。そこから失点率をどういうふうに「守備から独立した」ものにするか(あるいはしないか)、リプレイスメントの水準をどう考えるかなどはいろいろな可能性があるというお話。
共通するフレームワークに基づく実践的形態の違いで、FanGraphsのWARとかBaseball ReferenceのWARとかが出てくるわけですね。

WARと言われると複雑そうでよくわからないと感じても、例えばRSAA(=(リーグ平均失点率-失点率)×(投球回/9))になじみがあれば、それをベースに考えることもできます。
比較基準をリーグ平均から控えのレベルに変えて、最後に10で割って単位を得点から勝利に変えれば(フレームワークとしては)WARになります。

最終的に「納得のいく総合評価」にするために細かいところを考えはじめればキリがありませんが、枠組みだけなら簡単ですし、上の式で本質はおさえられます。

スポンサーサイト

守備位置補正の考え方


Visualizing outfield defense and positional adjustments

以前にTwitterのほうにも上げたのですが、WARに出て来る守備位置補正に関する記事。これは守備位置補正の考え方を視覚的に納得してみようという意欲的な内容ですが、わざわざこういった記事が出て来るように、そもそも守備位置補正関係は混乱が見られるようです。たしかにわかりにくい部分です。

少なくとも現在のところ、WARの守備位置補正は、抽象的な意味での難易度や「重要さ」に対するボーナスといったものではないし、そういう雰囲気で考えないほうが理解しやすいというのが当方の捉え方です。そもそも「全守備位置の野手平均」と比較して全ての守備者を評価する守備評価手法があればそれでいいのですが、現実的には守備指標(UZRやDRS)の計算が守備位置ごとでしか出せないので、守備位置を超えて比較するときには埋め合わせが必要になるというだけだと(守備位置補正の概要については過去記事をご覧いただければと思います)。

例えば三塁手の選手が遊撃手にコンバートされたら付与される補正値は上がりますが、(平均的に言えば)ちょうどその分UZRが下がることが見込まれるのであって、最終値であるWARの値は変わりません。補正値を並べたときに遊撃手の値が高いからといってWARが評価の価値判断として遊撃手を優遇しているとか、遊撃手での出場が有利になるとかいうことではないわけです。というよりむしろ、守備位置ごとの変な有利不利が出ないためにこそ補正値が存在します。

ニュアンスを強調するためにちょっと強引な比較を出せば、wOBAでは四球より本塁打のほうが係数が大きいですが、それは統計的事実として本塁打のほうが四球より点になることを単純に反映しているだけであって、特に本塁打が優遇されているとか本塁打を打つ打者が「有利」とは言わないのと同じことです。得点と失点への影響をクールに計量しているだけです。守備位置補正に関しても「三塁手と遊撃手では価値が違うからその分ポイントをあげましょう」というような漠然とした表現よりも、テクニカルなものとして理解したほうが(めんどくさそうだけど、結局は)戸惑いが少ないような気がします。

じゃあ、その適切な値はどうやって計測するのですか、というと難しいのですけどね。個人的には、Tangotigerがやったような守備指標からの導出は、もちろん理想としては正しい道であるものの実際には強引といえば強引だと思っています。そして打撃指標から出すのは、ある種の大胆な割り切りを持てば(数字的にも理論的にも)結構キレイにいくのですが、強引といえば強引だと思っています。

WAR改善に向けた話

『セイバーメトリクス・リポート』『セイバーメトリクス・マガジン』などを発行しているDELTAが2012年、2013年と算出しているWARについて、今後の改修に向けた議論をしたいと思います。
はじめに断っておきますがここでの議論は何らDELTA関係者としてのオフィシャルなものではなく、単なるセイバーメトリクス好きとしてこう変わっていってくれたらいいなぁという検討です。

以下、アメリカのバージョンと区別するためにDELTA社算出のWARをdltWARとします(これも何らオフィシャルな呼び方ではないので注意)。特に挙げている順番に意味はないです。



#1 投手評価をFIPからtERA(tRA)に

個人的には前々から是非ともと考えていたところで、結果的な貢献度の評価指標としてはFIP(BABIPの高低完全無視)よりもtERA(発生した打球の種類までは投手の責任)のほうが望ましいと考えます。SMM2でも打球種別の得点価値が出ており既に日本でtERAの算出自体はできるわけですので、これは単純に置き換えればいいだけかと。


#2 パークファクター補正の導入

いわゆる統一球うんたらかんたらで現在特に取り扱いが難しいところではありますが、投打ともにパークファクターに関する補正はやはり外せないところかと思います。意外とアメリカのサイトや文献でここの計算式をきちんと示しているところって少ない(みんな細かいところは興味ない?)のでどうするか迷う部分も少しありますが、先日整理してみたような形かあるいはplay-by-playデータを使っていいなら、自分は以下のようにやるのもわかりやすいかなぁと考えています。

打者の補正値(wOBAから減算):(ホームでの打席/打席)×(ホームでの両軍合わせたwOBA-ビジターでの両軍合わせたwOBA)

投手の補正値(tERAから減算):(ホームでの対戦打席/対戦打席)×(ホームでの両軍合わせたtERA-ビジターでの両軍合わせたtERA)

これだとよく言われる得点価値の補正に直接的にはならないのですが、得点を直に扱うよりコンポーネントのほうが数が多いので仮に1年だけで見ても相対的に安定した数字が得られると考えられること、リアルな得点をねじ込むよりWARで測定の対象としている指標でPFを測ったほうが論理がスッキリすること、に魅力があると考えています。たしかColin WyersがどこかでこういうリニアなPFの計算を議論していたと思うのですがちょっとどのサイトだったか思い出せず。もちろん得点を試合数で割るやつで普通にやっても全然問題ないのですが。


#3 日本版守備位置補正値の算定

現在dltWARではfWARで利用されている守備位置補正値を少し修正して使う形となっています。守備位置補正の対象となる実態はおそらくMLBとNPBで大勢は変わらないものの同一ということはないと考えられるため、日本に合わせた補正値を出すことが望ましいと言えます。

fWARはTangotigerが守備指標から「捻り出した」補正値を使っていますが、日本では打撃指標の側から補正値を導き出すしかないでしょう。実際的な事情としては打撃指標から補正値を導くのはよくある話ですし、MLBの結果で照らす限りは数字自体そう違ってこないことはわかっています。

このあたりを正当化する理屈としては(荒いのであまり引っ張り出したくないですが)以前このブログで総合評価をする際にも議論していますし、Bill JamesもThe Fielding Bible 2で打撃指標を使った守備位置補正値を出して総合評価に使用しています。またTangotigerのブログでも最近議論があったところで、守備指標からやるべきだという主張ももちろん理解できますが、個人的には守備指標からやるのは理論的には望ましくても実際問題強引になりがちなので打撃指標を使っておくのは必ずしも妥協ではなく積極的な選択でもあり得るかなと考えています。

どのくらいの期間を対象にとって補正値を計算するかですが、一部の選手のパフォーマンスに影響されず一般的な法則のようなものを出したいので、20~30年くらい見たほうがいいのかなと思います。要するにコレなんですが、日本のデータでは外野手を区別して計算するのが最近の数年しかできないんでしたかね。


#4 リリーフ評価にレバレッジを導入

理屈付けに関してはこのブログでも少し議論してきたところですが、リリーフの特性を考えると現在MLBで行われているWARに(LI+1)/2のボーナスを与えるのはまぁ妥当なところだと思います。問題はLI(WE)の数字をどうやって出すかで、個人的には正直ちょっと手に負えないところ。


#5 ベースランニング評価の追加

現状は盗塁・盗塁刺だけの評価となっていますが、走者として安打の間の進塁なども評価されるとより包括的な評価となります。要するにコレができればいいという話で、あとはもうどこまで細かく項目を入れるかだけです。得点としてのインパクトは小さいですし、手間はかかりますけどね……。


#6 UZRのリーグ合計をゼロに

以前からこの辺はどうするべきなのかと思案していたところなのですが、個人的にはdltWARに使われているDELTAによるUZRを特定のリーグ・守備位置について合計したときにゼロにならないのが気になります。パフォーマンスの良し悪しそれ自体ではなくwRAAなどのように相対的な利得の大小を表すRelative系スタッツの性格上「リーグ平均値=0」の性質は外せないかと。

FanGraphsのUZRでは各ゾーンのアウト率の算出は過去6年のデータに基づいているということで、30球団162試合のMLBですら十分に大きなサンプルを確保するために6年のデータ必要ということなのでNPBでもゾーンの基礎データはできるだけ多くのサンプルを集めることが好ましいでしょう。

で、FanGraphsのUZRは6年分の基礎データを使って算出したUZRをその年・リーグの平均が正確にゼロになるように調整しているということですが、そこの計算ロジックは書かれていません(見逃しているだけでどこかに書いてあるのかな?)。というのもwOBA→wRAAを計算するときの打席数にあたるものが必要になるのですが、それが何なのか。BBTFの記事を見るとMGLはUZRにおける「機会」を「獲得アウト数+許安打の責任分」と定義している(player's "chances" in any particular zone is defined as that player's number of outs plus the number of hits he is responsible for. )のでおそらくそういう類の数字を使っているものを推測します。日本でもこれを求める必要があるのでしょう。自分はSMM2の分析でUZRをノーマライズする際、打球ごとに平均的に見込まれる守備位置ごとのアウト獲得数を機会として集計しました。計算は少し違いますが結果はそう変わらないと思います。

ただFanGraphsのデータを見てみるとAL・NLそれぞれでUZRを合計したときにゼロになるわけではなくMLB全体でゼロになるようになっていて、この辺の思想はよくわからないです。平均をセパ合計でとるにしろ分けるにしろ「基礎データを複数年で取って、それから平均をゼロに合わせる」仕組みは必要だと思うのですが、どうも自分が何か勘違いしているところがあるのかなぁ。


#7 打撃評価の解像度向上

このあたりはモデルとして決定的ではなく影響も少ないマイナーなところですが、個人的にBaseball Referenceがやっている「内野安打と外野安打の区別」とか「併殺打回避得点」など一般的なwOBAの式より細かく打撃の内容を見る計算はある程度は重要だし筋に無理もなく、もしデータが出せるなら計算もさほど複雑にならないので好ましいと考えています。併殺打のほうは最高と最低で10点くらい差がつくということですから、本来無視はできないところです。





以上思いつくままに挙げてみました。あとはリプレイスメント・レベルの設定が本当に今のままでいいかとか検討すべき点はあるのですが、多分その辺は掘っても何も出ないというか、計算結果は変わらなさそうな気がしています。


wRAAのパークファクター補正

本当は「現在算出されている日本のWARをこう変えていこう」という議論をしたくてできていない中、今日はなんとかパークファクターについて考えてみようかと思います。

『セイバーメトリクス・リポート2』に掲載されたWARはパークファクターによる補正がなされていない値でした。しかし、球団によってそれぞれ本拠地球場があり球場の特性は様々であるため、本拠地によってWARの計算に含まれるような要素(要するに安打の多さなど)に有利不利が出ることは間違いありません。そこで、パークファクターという球場の特性を数値化した指標を用いて補正をすることがMLBの方では当然のように行われております。日本でもこれを適用したいところです。

そのパークファクター補正には色々なやり方が考えられるのですが、ここでは自分なりのロジックを考えてみます。打撃の評価であるwRAAの補正に関して、計算の手順を追う形で見ていきます。


(なお、パフォーマンスそのものの補正ではなくて得点への影響を補正すること、計算される補正値は選手の力によるのではなく機会に対する加算であること、という認識を前提としています。ちなみにレートスタッツ(例えばwOBA)の補正については「パークファクターの平方根でwOBAを割る」という古来から伝わる方法があるのですが論理的でない感じがするので置いておきます)



   (本拠地球場での試合あたり得点+失点)
PF=―――――――――――――――――――――
   (本拠地以外の球場での試合あたり得点+失点)


まずはパークファクターの定義。これは説明不要かと思います。
以下の目的では機会を「試合」ではなく「打席」にしたほうがよいかと思うのですが、大差はないのでとりあえずこれでいきます。
ちなみに結果的に生じた偏りを評価できればいいのではなくてできるだけ「真の値」を知りたいので、できる限り多くの年度をサンプルとして取り込みたいところです。ただし改修など条件が変わると過去のサンプルは意味がなくなる(大きな変化がないとしても意味が薄くなる)ので難しいところ。サンプルが少ないなら特にですが、regressionを適用することも考えられます。

補正係数=(本拠地試合/総試合)×PF+(1-本拠地試合/総試合)×(6-PF)/5

全ての試合を本拠地で行うわけではないので、本拠地で試合をした割合がどのくらいかを考慮して補正のための係数を計算します。本拠地で試合をした分には本拠地のPFが適用され、これが右辺の前半です。そしてPFは1が標準なのでリーグ全ての球団のPFを足し合わせると6で、ここから本拠地球場のPFを引いて5で割ることで「本拠地以外の試合の平均PF」が求められ、これを本拠地で試合をしない割合に乗じます。すなわち補正係数というのは、本拠地のPFと本拠地以外のPFを試合数に応じて加重平均したものです。
なお、一般的にシーズンを通じて出場する野手にはこれでよくても出場する球場が偏る可能性のある投手については個別の事情に応じた補正係数を出すのがベターであると思います。ただ、定量的には特に気にするレベルの問題ではないと考えられます。

補正値=(1-補正係数)×リーグの平均打席あたり得点×打席

補正係数を使ってどれだけ得点の意味で影響があったかを出します。PF(補正係数)が「得点の意味で平均に対して何倍」という形をしているのでこれをリーグの平均的な打席あたり得点数に乗じるとその条件で平均的な打者が打った場合にどれだけの得点が生まれるかが計算でき、対象とする打者の打席数の分それが積み重なります。平均的な球場で打つ場合との差が補正すべき値(その打者の貢献による価値でない部分)で、そのことをまとめたのが上の式です。

補正wRAA=wRAA+補正値

最後は足すだけ。

投手についても、打席をイニングに置き換えることでFIPを補正できるものと思います。ただ、FIPが分母をイニングにしているのは便宜的なもので私としては投手に与えられている機会も打席であると考えたいので、本来的にはWAR算出の過程で打席を機会として補正するのがいいような気がします。

以上が私が考える算出ロジックなのですが、Baseball-ReferenceのWAR算出説明ページを見ると「wRAA_pf = wRAA - (BPF/100 - 1) * PA * lgR/PA / (BPF/100)」という式が出ていて、最後の部分がこちらの案と違っていてちょっとよくわからないです。詳しい方に解説いただけたら物凄く幸いだなぁと思っている次第です。


--------------------

オマケで上記B-RのページのwRAA算出そのものについても考えてみたのですが(若干長くなる上に細かいところなので無視していただいても大丈夫です)、筋道を辿ってみるとちょっとしっくりこないという感想を持っています。B-Rの算出式によれば、wOBAを出すときの分母は「打数+四球-故意四球+死球+犠飛」です。これは問題ありません。

しかしwRAAにするときの掛け算では「打数+四球+死球+犠飛+犠打」ということで故意四球と犠打が機会に加わっており、たまたま巡り合った状況や恣意的な作戦が影響する性格が強い故意四球と犠打に関してはwOBAを出すときは無視するもののカウンティングスタッツであるwRAAを出すときには「もし打っていたら他の打席と同じようになっただろう」と想定するものとしているようです。

ちょっとこれらのスタッツの原型であるBatting Runsに戻ってみましょう。計算の仕組みを示すだけなので係数はなんでもいいですが例えば

Batting Runs=0.3×(四球+死球)+0.48×単打+0.78×二塁打+1.04×三塁打+1.40×本塁打-0.26×(打数-安打+犠飛)

だとします。この式の場合、犠打は自分が打って出る打席とは別に扱って、いわば無視しているわけです。BtRは一般的にこのような形で使われていますし、ヒッティングして生じた結果に評価として得点価値を掛けて合算するという考え方に何ら不自然な点はありません。

wOBAは、出塁率スケールに直す部分を飛ばして考えれば要するにBtRを打席で割ったものです。このとき、BtRで無視されている犠打の分を分母となる「打席」から除くのは自然なことです。

しかしwOBAからwRAAを出す段階で犠打を含めた打席を乗じてしまうと、(B-Rがそう想定すると明示的に述べているように)他の打席の仕事が犠打をした分の打席まで「引き伸ばされて」しまいます。本来のBtRからすると値が「打席/(打席-犠打)」倍されるイメージです。

これはそもそもBtRからすると不自然なのではないか?というのが私の考えで、wRAAを出すときに乗じるのはwOBAの分母と同じ項目にしたほうがいいのではないかと考えます(逆にB-R方式が正しいとする立場からすると、普通にBtRを出すとき最後に「犠打×(BtR/(打席-犠打))」の項目を加えないとならないのではないでしょうか)。

ただこれは必ずしもはっきり結論が出せるというものでもなく、次のような思考実験も考えられます。
能力の全く同じA打者とB打者がおりともにフルシーズン出場したとして、A打者は600打席でwOBA.350、wRAA +10。一方B打者は本当は600打席となるはずがそのうち50打席で犠打を命じられ、wOBAの分母が550となって、wRAAの計算に犠打を含めない場合wRAAが9.2となるようなケースです。この場合では、全く同じ能力の打者で出場量も同じなのにそのうちに(状況やベンチの志向という選手の責任でない要因により)犠打が含まれていたら評価が変わるのはおかしいのではないか、という主張も考えられます。このケースで両者を同じように評価したいと考えれば、B-R方式を支持することになるでしょう(もちろん他にもB-R方式が正しいとする見方は色々出せるかもしれません)。
ただ個人的にはどうも「起こっていないこと」に評価を与えている感じがするのです。従来のBtRを素直に出す考えからいけば、wOBAとwRAAで機会は揃えるのが自然ではないかと思います。



WARを知るためのリンク集(主に英語)

『セイバーメトリクス・リポート2』において日本版が算出され、とうとう日本でも実際に活用できるようになった総合指標WAR。日本では馴染みがない指標であり、『リポート2』に一通りの解説は書かせていただきましたが、そうは言っても詳細について疑問点をお持ちの方も多いでしょう。

そこで、私自身がWARについて学んできて役に立ったウェブ上の文献を紹介してみようと思います。私も決してWARのマスターではなく勉強中の身であり、全てを知り尽くしているわけではないですから情報には偏りもあるとは思いますが、多少なり「WARについてもっと知りたいが何を読めばいいのかわからない」という方のお役に立てれば幸いです。

ただし、現状では残念ながら日本語で十分な情報がなく、詳しく知りたければ英語の情報にあたるしかありません。ここで紹介しているような内容について、部分的には日本語で当方のサイトに載せているところもあるので興味があれば見ていただければ。

本当に隅々まで探究していると果てしない時間がかかりますが、まず全体について知りたければ最初の「WAR全般」で紹介しているFanGraphsBaseball Referenceによる解説どちらかのシリーズをじっくり読んでいただければだいたい概要がわかると思います。読み進めていけばその中で詳しいリファレンスへのリンクも貼られているので、そこで納得できれば当方が載せたものを隅々までチェックする必要はありません。


※ここで書いているのはあくまで執筆時点(2013年4月)の情報で、WARの計算はどんどんアップデートされるのでご注意を。閲覧の時点によっては、WARの内容がここでの説明と変わっている可能性があります。新たに良いリンク先を見つけたり重要な改訂が加わった際にはこの記事を更新する可能性はありますが、情報が最新であることは保証しません。



WAR全般


How to calculate WAR

まずは、セイバーメトリシャンのTangotigerが「WARはこう計算するもの」と提唱した記事。
これは算出ロジックの提出であり、現在この方法に従って算出されたWARがどこで閲覧できるというものではありませんし、この記事では考え方について詳細な説明があるわけでもありません。しかしTangotigerは理論家として最も信頼に足る人物の一人であり多くのセイバーメトリクス研究において参照されていますし、ここで与えられている算出の骨格を見ておくことは重要です。当記事の以下でもTangotigerのブログの内容は多く紹介することになります。Tangotiger自身の記述だけでなくコメント欄でなされている議論(一流のセイバーメトリシャンが多数登場)も重要です。
また、ざっと流れを追えばなんとなくでもWARの数字についての計数的な感覚が掴めます。


What is WAR?

セイバーメトリクス情報サイトFanGraphsが算出しているWAR説明。ここからFanGraphsにおけるWARの算出方法を詳しく述べたシリーズ記事へリンクで飛べます。簡潔ながらある程度ステップ・バイ・ステップで丁寧に説明してあり、議論になるポイントなどもおさえてありますので参考になります。
また以下でも紹介していきますが、FanGraphsサイトにある用語集はWARに関連する指標や用語についても多数詳しく解説してあり、リファレンスとしては大変有用です。


WAR Explaind

WAR算出に関してはFanGraphsと両雄で、より詳細な計算をしているとも言えるBaseball ReferenceのWAR説明。
端から端まで全て読むと分量は膨大ですが、具体的な計算方法も明確に示してあり、その手順を自ら確認しながら読んでいくとWARについてかなり具体的な感覚として理解ができること間違いなしです。FanGraphsと算出方法が異なる主な部分について説明なども与えられています。





打撃評価


A Brief History of Run Estimation: Batting Runs

打撃を得点によって評価するBatting Runsという指標の紹介。
打撃の評価は、安打や四球など発生した出来事(event)に得点価値を与える形で行われます。打撃の評価は伝統的に数字を結果として受け止めることが親しまれており、それ自体に議論は生まれにくいです。なので、重要なのは塁とアウトの状況から実際に発生した得点の平均値という統計(得点期待値)を利用すること、それによって各打撃事象の価値が客観的に決まること、勝利は得点と失点で決まることから選手の働きを得点の観点で見るのが重要なこと、の理解がとにかく重要です。このような仕組みがLWTSと呼ばれるもので、それを打撃に適用して評価指標としたものがBatting Runsです。LWTSの理解は投手の評価でも守備の評価でも重要なので、抵抗が少なく直感的にイメージしやすい打撃の部分でしっかりおさえましょう。
日本語では当方のサイトの「基本的な考え方」の「得点期待値」の項でBatting Runsを説明しています。


Weighted On Base Average or wOBA

wOBAが発表されたTHE BOOKの抜粋。
WARにおける打撃の評価は、実質的には上記のBatting Runsです。しかし、様々な場面で活用される指標としてwOBAという便利なものをTangotigerが開発しており、FanGraphsやBaseball Referenceの算出ではこのwOBAを利用して最終的にBatting Runsの形式に換算する形で算出を行っています。wOBAはBatting Runsを打席あたりの「率」で表す指標にしたもので、LWTSの原理からwOBAを導出する過程が簡潔に書かれています。


The History of the wOBA, part 1

そして開発者のTangotigerによるwOBA開発の経緯や解説。なぜwOBAという指標が存在するのかやその意味についてより詳しく知りたいという場合はこちらをご参照下さい。





走塁評価


Ultimate Base Running Primer

FanGraphsのWARで採用されている走塁評価であるUBRの説明。得点期待値を使って得点化という意味で打撃評価の延長線で考えることができ、対象がベース上の動きで機会が打球になる点などロジックさえおさえれば特に難しくはありません。なおBaseball Referenceの走塁評価はWARの説明において算出法が明記されています。





投手評価


Defensive Responsibility Spectrum (DRS)

FanGraphsのWAR計算ではTangotigerが開発したFIPという投手の評価指標がベースになるのですが、そのFIPの紹介。かなり簡潔な記事で、これを読んだからすぐに理解ができるというものではないのですが、とりあえず開発者による記事はおさえておきましょう。


Evaluating Pitchers with FIP, Part I

一見すると雑にも感じられるFIPの式がどう導出されるのかについての数理的な説明。要するにLWTSで、守備の関わる部分(単打・二塁打・三塁打・凡打)が全ての投手について一定の割合で生じると仮定した計算をすればFIPになるというだけの話です。上記を参考にした日本語記事はこちら


Tango’s Lab: Deconstructing FIP

同じくFIPの数理について、考案者による記述。wOBAとの関連なども見えます。


Pitching and Defense

FIPの式の構造は上記でわかりますが、FIPで投手を評価することの理論的な妥当性については、結局のところ(本塁打を除く)被安打を投手の責任としないことに妥当性があるかに尽きます。これをBABIPの論点と呼びますが、セイバーメトリクスにおいて最も重要な論点のひとつであり、最も理解が難しい(というか誰も完全な答えを出せない)論点のひとつです。BABIPの議論を知るためにはいくつもの文献を読みたいところですが、まずは理論の提唱者であるボロス・マクラッケンの論文です。


Can pitchers prevent hits on balls in play?

マクラッケンによる「投手は本塁打以外の打球をコントロールできない」という主張に対して、いや完全にコントロールできないわけではない、という反論を提出した論文。長いですが一読に値します。


Solving DIPS

複数のセイバーメトリシャンがBABIPについて議論した論考。リンクはPDFファイルなのでご注意を。上記の「ヒットは運だ」「いや完全に運ではない」という議論に対して「最後は程度の問題だよね。では、どの程度?」という部分を具体的に分析しています。BABIPの高低の動きについて、どのくらいが運によるもので、どのくらいが投手の実力によるもので、どのくらいが守備力によるものか、についてのひとつの答えがわかります。


Infield Flies, FIP, and WAR

FanGraphsのWARは、当初普通に奪三振・与四死球・被本塁打という3要素のFIPを使って計算していたのですが、内野フライも守備力に関わらず確実にアウトカウントが増やすことができ走者も進めないことから、結果として投手の自力によるアウトの増加で奪三振に等しいと考え、内野フライを奪三振と同じように扱ってFIPを計算する形に改訂されています。


Pitcher WAR Calculations and Details

こちらはBaseball ReferenceのWARにおける投手評価の解説ページ。FanGraphsとBaseball ReferenceそれぞれのWARは投手評価の部分で大きく手法が異なっています。結果としてのチームの失点には投手の責任と守備の責任が混在しているわけですがFanGraphsのほうははじめから投手の責任だけの数字を抜き出してヴァーチャルな失点を組み立てる方式であるのに対し、Baseball Referenceにおいては全体の失点をベースとしてそこから守備の影響を除外するという方法をとっています。両方を知った上でどちらの方式が自分好みかを考えてみるのも面白いです。


Crucial Situations

リリーフ投手の評価には、登板した局面の重要度を評価するLeverage Indexという指標が関わってきます。そのLIについて、考案者であるTangotigerによる解説記事。





守備評価


UZR Primer

MGLによるUZRの概説。WARの守備評価はFanGraphsではUZR、Baseball ReferenceではDRSという指標をそれぞれ採用しています(これらは特殊なデータを必要とするためそれらのデータが得られない過去の期間については代替となるまた別の指標)。
UZRとDRSは異なる結果を出しはするものの基本思想は共通しており相関関係もあります。上記のMGLによる概説は計算方式や利用にあたってのポイントなどわかりやすく示してありますので、まずはこの記事でUZRをしっかり理解しておくとよいかと思います。


John Dewan (and research assistant) speak!

UZRとDRSの違いについて。


UZR

FanGraphs用語解説のUZR項目において、その他有用なリファレンスへのリンクも貼られています。





守備位置補正


Positional Adjustment

各守備位置ごとの評価となっている守備評価について、WARにするには異なる守備位置同士でその価値を比べるための補正値が必要となります。こちらは細かいデータを抜きにした概説。


Fielding Position Adjustments

Tangotigerによる守備位置補正についての初期の探究。複雑で手品のようにすら見えますが、非常に尊敬すべき研究です。算出のロジック確認に。


UZR positional adjustments, revised with 2008 UZR

ひとつ上の記事より時期的に後の、UZRを使った探究。コメント欄で現在使われる数字にあたる結論が出ています。


Paradox of the DH adjustment

ちょっと不思議な「DHの守備位置補正」について。


Historical Position Adjustments

守備位置補正を歴史的に見た論考。





リプレイスメント・レベル



Why Replacement Level?


なぜリプレイスメント・レベル(代替水準)という基準を用いるのかについて。なお、この点についてはKeith Woolnerによる「Introduction to VORP」という名論文があったのですが、現在ウェブ上から消えてしまって見れないようです。キャッシュの検索をすると見つかったりもするのでなんとかそちらを読んでみるというのもいいかもしれません。ざっくり日本語にしたものを当方のサイトに掲載しています。


The Official Replacement-Level Thread

Tangotigerがリプレイスメント・レベルを数量的に定義している記事。彼はリプレイスメント・レベルを勝率の形式で定義することを好んでおり、この方式は慣れるまではわかりにくく、どういう条件を設定して勝利を算出しているのかを注意深く見る必要があります。もし「ピタゴラス勝率」についてご存じない場合には、先にそちらを把握しておいたほうがいいかもしれません。


Replacement-Level Fielding

WARにおいてリプレイスメント・レベルの守備はリーグ平均と同一とされるわけですが、そのことが明快に示されるTangotigerによる分析。また、この記事のコメント欄ではさらに打撃も合わせてリプレイスメント・レベルの検討が行われており、個人的には(意外に根拠が不明瞭なリプレイスメント・レベルについて)極めて重要な議論がなされていると考えます。


The Replacement Pitchers

投手のリプレイスメント・レベルについて。なかなかトリッキーです。


Unifying Replacement Level

FanGraphsとBaseball Referenceは当初異なるリプレイスメント・レベルを採用しており、混乱の元となることも多かったのですが統一基準が設けられました。「30チーム162試合で得られるMLBの2430勝のうちWARを1000としてリプレイスメント・レベルを設定」といった言い回しははじめは慣れないかもしれませんが、数学的に複雑なわけではなく冷静に数字を追えばわかります(この一文からTangotigerが出しているような「リプレイスメント・レベルのチームの勝率」を自分で計算して導けると、周辺のロジックを理解している証拠と言えるかもしれません。ちなみに、答えは.294になります)。


Replacement level defined

直接WARの根拠になるわけではありませんが、Tangotigerとは少し違う角度から見たリプレイスメント・レベルの実証研究。





得点・勝利換算


Runs Per Win

WARは大部分の計算は得点数を単位として行われ、それが最後に勝利数に変換されます。具体的な操作としては、得点数を10あたりの数字で割るだけです(得点が10増えれば勝利が1増えるため)。このことについて述べて関連する項目へのリンクも貼ってあるウィキの項目。


Why 10 runs equals 1 win

どうして得点が10増えたら勝利が1増えるのかについて直観的に理解できる説明。





WARの解釈や活用


Misconceptions about WAR

FanGraphs用語解説より、WARの誤解されやすい部分について。


Misconceptions of WAR

Tangotigerによる誤ったWAR理解へのツッコミ。


WAR is the answer

有名どころであるESPNでもWARが取り上げられています。


My Answer to “I Don’t Like How Complicated WAR Is and How It Is Constantly Changing.”

やたらに複雑ですぐに計算方法が改訂されるからWARが信用ならない、という意見に対する反論。社会的に利用されているGDPと対比するとわかりやすく、指標の本質ではない表面上の操作や手続きだけを見た揚げ足取りの議論は生産的でないことがわかります。




 | HOME |  »

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。