Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

WAR(Wins Above Replacement)とは何か

どうも前々から、サイトに「WAR」で検索して来る方が多いようなので、あまりしていないサイトの更新のアリバイ作りもかねて概説を書いてみました。→WAR(Wins Above Replacement)とは何か
Wikipediaで執筆もされているようですし他にウェブ上で解説もあるんですが、考えてみれば自分でまとまった説明を書いていなかったなぁと。

とりあえずブログのほうにも載せておきますが、そのうち(いつになるかわかりませんが)サイトのほうでFanGraphsをモデルとして算出方法の詳しい説明を加えたいと思っています。今はまだ概説。



1.WARの概念

 WARとは打撃・走塁・守備・投球といった野球におけるあらゆるフィールド上のプレーを統計的に評価し選手の総合的な貢献度を表す指標です。Wins Above Replacementを日本語訳すれば「勝利数代替水準対比」といったところでしょうか。すなわち、WARは選手のプレーを「同じ出場分を最小のコストで代替可能な選手を出場させる場合に比べてどれだけチームの勝利数を増やしたか」という尺度で評価します。

 従来、例えばRCでは、打者同士を比較することは可能です。また、FIPによって投手同士を比較することもできます。しかし、RCが87の打者とFIPが3.28の投手のどちらがすごいのかといったことは比較できません。WARの最大の特徴は、これらの評価を統合して、打撃に特化した選手であろうが、守備に特化した選手であろうが、投手であろうが、全ての選手を同じ土俵で比較できるようにした「総合評価指標」であるところです。ある意味では、数多くの指標を生み出してきたセイバーメトリクスにおける究極の指標であると言うこともできるでしょう。例えば、ある打者のWARが5.4であり、ある投手のWARが3.1だった場合には、打者のほうがチームの勝利を増やすのに貢献したと簡単に判断することができます。

 では、WARはどのように計算されるのでしょうか。実のところ、WARというのは定まった方法で算出されているひとつの指標というわけではありません。WARとは指標の名前でもありますが概念・枠組みの名前でもあり、研究機関によって複数のWARが提唱、公表されています。WARの算出・公開をしている機関として代表的なものはFanGraphsとBaseball Referenceです。いずれも米国のサイトであり、MLBの選手を対象にして算出が行われています。残念ながら、2012年1月現在私の知る限りでは、日本プロ野球を対象としたWARの算出は行われておりません。


2.算出の概要

 WARの一般的な枠組みは「攻撃評価+守備評価+守備位置補正+投球評価+代替水準対比価値」です。そしてプレーの価値の量的な測定は、基本的に対象の選手による働きがチームの得点及び失点の増減にどのような影響を与えたかという観点によって行われます。

 例えば四球はチームの得点を平均的に0.3点程度増加させ、本塁打は1.4点程度増加させます(このような数値は統計データによって明らかとなります)。これらの数値に基づいて各選手の責任範囲のプレー、すなわち打者であれば打席の結果を点数化していきます。守備に関してはどれだけ打球をアウトにしたか等をこれまた得点の価値によって評価します。投手についても被打撃成績を得点化する評価を行うのですが、守備の影響によって有利不利が生じないようにこれを調整する措置が施されます。各種の数値には、球場の影響などについての補正も適宜行われます。また、守備についてもあらゆる守備位置の選手を同じように比較することが可能となるよう守備位置ごとに調整値が与えられます。

 最終的にそれぞれの働きの得点の価値を、最低年俸レベルの選手が出場した場合に生産するであろう評価と比較して、対象の選手が生み出した余剰の価値を割り出し総合します。これを得点数から勝利数に換算したものがWARの最終値となります。

 少し知識がある人向けに簡単に言いますと、FanGraphsのWARにおいては、打者はwOBAを基に評価、守備はUZRを基に評価、投手はFIPを基に評価されます。それぞれ得点の単位に結びついた指標ですので、単位あたりの代替水準選手との差をとって出場機会を乗算すればWARとなっていきます。

 WARは総合評価ですので、打撃だけ、守備だけなど特化した働きでは必ずしも優れた数値を残すことはできません。まさしく総合力に優れている選手が高いWARとなります。また、投手と打者も「その選手が出場したことによるチームの勝利数の増加」という同一の尺度によって定量的に適切に比較されます。


3.WARの活用方法

 WARの活用方法としてまず思い浮かぶのは、MVPの選定や年俸の査定といったとにかく「その年の実績」を評価する場面でしょう。野球チームにとって一義的に最も重要なのは勝利数という要素である以上、それに最も貢献した選手がMVPに選ばれる、あるいは最も多くの報酬を受けるというのは自然です。もちろんWARが選手の働きを本当に完全に評価するものであるとはなかなか言い切れないので、WARの数値の通りに年俸(MVP)が決定されるべきというわけではありません。しかし、おおいに参考にはできるはずです。

 また、通算のWARを取り上げて、殿堂入りに誰がふさわしいか、歴代で最も優れた選手は誰か、といったファンの議論の材料とするにも適しています。

 一方で、選手の潜在的な能力を推し量ったり将来を予測したりするためのものとしては必ずしも適していません。多く本塁打を打ち高いWARを残したとしても、それはその年たまたま調子が良かっただけかもしれないからです。WARは潜在的な能力を測ろうとしているのではなく、選手による結果的なパフォーマンス、貢献度を測る指標です。

 ちなみに算出法にもよりますがWARは平均的な打者ではだいたい2.0程度になります。これは平均的な選手と代替水準の選手の、年間における差です。一方特に優れたMVPクラスの選手では10前後になることもあります。
 WARの値がマイナスとなる場合、理論上は最低レベルの選手を出場させたほうがよかった、ということになります。ただしマイナスのWARというのは出場機会が少ないことによる数字のブレの場合が多いです。



スポンサーサイト

投手成績の本質観


Attribution v Actuality (THE BOOK BLOG)

例によってTangotigerのブログから。ここでの指摘は極めて簡潔です。

投手の成績はその投手がマウンドにいる間に彼のチームが何を成したかを表すのであって、(必ずしも)その投手がマウンドいたから起きたことを表すのではない。

これ、ほんとにそうですよね。個人的にもこういうことを思ってはいたのですが、すっきり言葉にはできずにいました。

根本的に、何を記録しているかというと、チームとしての結果を記録しているのです。投手の成績というのはチームの成績のことです。極端なことを言うようですが本当に。チームの成績を、誰が登板している間に起きたかという視点で区切って分配しているに過ぎません。

「勝利」とか「敗北」を一人の選手に付するなんて象徴的で、改めて考えると物凄く大胆なことと思えます。チームの成績にはその投手も当然影響していますが、それ以外に守備者等も影響しているわけで、それらをガン無視というかとりあえず置いておいて投手のものとして扱ってしまうというのはかなり急進的な発想ではないでしょうか。

別に、それが悪いと言っているのではありません。そういうものだからそういうものとしてきちんと認識するのが大事だという話です。そう思えば、「投手の成績」をそのまま投手の評価とはせずDIPSなどの発想によって整理を行なうのは至極自然だと言えるでしょう(手法に関する議論はある程度あり得るとしても)。

実は投手の成績と全く同じようなものを、各守備者について記録することも可能です。坂本が遊撃手として守備についている間に起きた「奪三振数」や「被本塁打数」を坂本の守備成績として記録するということです。奇妙なようですが守備指標の計算で必要とされる「イニング」だって本質的にはこの種のものですし、また投手で採用されているような項目を守備者に記録することは有用なはずなんです。刺殺・補殺とイニングを組み合わせてRFを算出するだけでなく、打席数などの情報を元に対象の野手が守備に就いている間のインプレー打球(BIP)の数が分かればmorithy氏が提唱していてRFよりも適切な守備指標である奪アウト率の正確な数字を求めることが可能です。また、DER(被BABIP)も出せますから、守っている間のDERとそれ以外でのチームのDERを比較するということもできます。何故そのような記録がなされていないのか、不思議といえば不思議です。逆に言うと投手というのは本当に特別な地位が与えられているんだな、と感じます。

打者の成績に関しても本質的には同様のことが言えるんですが、ここに関しては特定の打席において「チームの結果」に影響する攻撃側の要因は基本として打席の打者一人だけである、という点に解析者はかなり助けられている気がします。仮にスイングを二人がかりで行う場合があるとしたら、安打がどちらの手柄かわからないですから打者個人の評価は一気に困難になるでしょう。

公式記録に「個人成績」なんて名目で誰々の安打数がいくつなんて載っていると安易に使用してしまいがちだけれども、その記録とはそもそも何かという問いは解析において非常に本質的だ、ということを再認識しなければと思いました。


セイバーメトリクスQ&A(3)

あけましておめでとうございます。
最近更新のペースが鈍く、今年もあまり加速しそうにはありませんが、なんとかやっていきますのでよろしくお願いします。

さて、新年一発目は、相変わらず答えるほどの知識があるわけでもないのにQ&Aです。読んだ方が何かしら得るキッカケになれば、ということで、いただいた質問に加えて前に書いておいた自作自演の項目も加えて。

毎度の注意書きですが回答は私の理解・解釈であり、セイバーメトリクス界の一般的な合意を代表するものではありません。また、指標についての説明も必ずしも考案者の意見を反映するものではありませんのでその点ご了承下さい。






Q.「シークレットソース」とは?

A.Baseball Prospectus社が示したポストシーズンにおける重要な要素3つのことですね。
BPの分析では、ポストシーズンの成功に関係する基本的な要素は以下だとしています。

・投手の奪三振率
・野手の守備力
・クローザーの能力

Baseball Between the Numbersという書籍に収録されている論文では、まずポストシーズンの成功をポイント方式で定義し(大雑把に言えば勝っていくほどにポイント加算)、そのポイントとレギュラーシーズンの成績にどのような関係があるかを統計の相関分析によって見ています。
その結果、レギュラーシーズンの得点能力はポストシーズンの成功と相関がない一方、失点阻止能力は弱いながら相関があると示されています。
そしてさらに失点の阻止を内容別に見ていくと、被打率とクローザーの成績が特に相関しています。
最終的に安打を防ぐということを個別の働きレベルに分解すれば「投手が三振を奪うこと(そもそも打球を飛ばさないこと)」と「野手が打球をアウトにすること」に分けられる、というわけです。

何故これらの要素がポストシーズンにおいて相対的に重要になるか、ということに関しては完全にはっきりはしていません。
しかしBPの論文では、(短期決戦がどうというより)ポストシーズンでは「悪いチーム」はそもそも存在せず「攻撃が普通で守備が優れたチーム」と「攻撃が優れていて守備が普通のチーム」しかいないことを指摘した上で野球の攻撃が非線形の構造をしていること、投手の支配力などがその条件に関係してきて結果的な傾向が表れたのではないかという仮説が示されています。
クローザーについては、ポストシーズンは短期決戦であるためレギュラーシーズンに比べてクローザーを重用することができることからその能力が相対的に重要になるということは比較的に容易に説明できるのではないかと思います。

最後に注意事項ですが、いわゆる「シークレットソース」の3要素はレギュラーシーズンに比べてポストシーズンでは重要度が相対的に、微弱ながら高いらしいということが示されているにすぎず、ポストシーズンになったら急にこれらの要素が試合を支配するというわけではありません。言うまでもなく打撃も重要であり、重要度が相対的に少し下がるらしい、ということにすぎません。これらの3要素が優れていたとしても、それ以上に優れた打撃力を持つチームに対すれば当然ながら敗れる確率のほうが高くなるでしょう。
またBPの分析結果はいわゆる「スモールボール」の概念とは直接関係はなく、攻撃スタイルとしてはスモールボールがビッグボールに比べてポストシーズンに有効であることの有意な統計的根拠はないとされています。



Q.WARにおける守備位置補正の根拠は?

A.守備指標によって測定される守備位置ごとの格差です。
具体的には、FanGraphsのWARではTom Tangoが提出した補正値を基にしています。
この補正値の原則的な導き出し方は、複数の守備位置を守った選手の守備指標(UZR)の比較です。
例えば一塁手としてUZRが+4である選手が三塁を守ったときのUZRが-6である場合、三塁は一塁に比べて10点分難しいらしいということがわかります。一人の選手のサンプルでは何も言えませんがこのような例について大量のサンプルを集めてあらゆる守備位置同士を比較していくと、守備位置を移動したときに守備指標がどのように悪化するかの一般的な傾向がわかります。そのように集積したものが補正値となります。

意味をわかりやすく理解するための思考実験としては、守備位置というものに関係なく仮想的に「まったく平均的な野手」がいると考える方法があります。その彼があらゆる守備位置を一通り守っていった場合、全体としてのUZRは±0です。
ここで、彼が遊撃を守った場合、UZRは-7.5になります。遊撃守備はそれだけ難しく、一般的に優れた守備者が守っているということです。逆に一塁を守った場合+12.5となります。
これを実際の各守備位置の選手の側から見ると、異なる守備位置の選手達を「野手全体の平均」という一定の視座から平等に比較するためには、遊撃手のWARには7.5を足し一塁手のWARからは12.5を減じる必要があります。UZRをはじめ基本的に守備指標は各守備位置の平均と比較した数字を算出するものであり遊撃手は全体として±0となりますが、遊撃という守備位置そのものが野手全体(の平均)から見れば+7.5の価値があるからです。
このような補正は単に抽象的な意味での難易度を表しているわけではなく、実利的なものです。例えば平均的な遊撃手を失ったチームが平均的な野手でその穴を埋め合わそうとすれば、失点が理論的には7.5増大することになる、という具体的な損得の値を示しているからです。

算出に関してもう少し付け加えておきますと、実際にはサンプルの質・量の関係で守備指標だけでキレイに補正値を出すことは難しいです。そのため補正値の算出にあたって部分的に打撃指標を援用したり(FanGraphsの補正値にもおそらくこの性格があるかと)、そもそも守備位置ごとの打撃指標の差をもって守備位置補正とするということもWARの算出においては行われます。

蛇足ですが、補正値はさまざまなサンプルのばらつきを均した結果の漠然とした「一般的な傾向」に過ぎず、実際に選手を動かしたときにどうなるかは具体的なケースによるはずで、その点では守備位置補正はWARにおける最も大きな欺瞞のひとつであるかもしれない、と個人的には思います。10何点かポイントを与えて「補正」したとしても、捕手と外野手を同一の序列で比較するということがそもそもナンセンス、という立場もあり得るでしょう。もっとも、最初からあきらめるのではなく突き詰められるところまで突き詰めてこのように具体的なものを提示することには非常に意味があると思います。問題は、それをどう扱うかに関してはただ鵜呑みにするのではなくて指標の知識を持った上で適切に扱わなければならないということでしょう。



Q.守備指標って信頼できないよね?

A.「信頼」の意味によります。
こういう場合の「信頼」という言葉には、統計学的にはふたつの意味があると考えられます。
ひとつはその数字が測定したいものをきちんと表していること(妥当性)。例えば投手の球速の速さを測るのに「速い投手は三振が多いはずだ」と奪三振率を使うのは論理が飛躍しており、目的とする要素がうまく測れません。平均球速を用いるほうが妥当でしょう。
もうひとつは、その数字が少ない誤差で選手の能力を表すこと(信頼性)。例えば打者のBABIPは長期的には打者の安打を打つ能力を表すと考えられますが短期的には変動の大きい数字です。
さて守備指標ですが、とりあえず代表としてUZRで考えてみましょう。
まず妥当性ですが、これは問題ないと思います。打球をアウトにすることが守備の原則的な働きであり、それが主観的にどう評価されようが、多くアウトを奪って失点の阻止に貢献しているならそれで問題ありません。バイアスを避けるための多くの補正もあります。
次に誤差の意味での信頼性ですが、これが問題になる場合が多いでしょう。「UZRの数字は3年で見なくちゃいけない」などとも言われます。
しかし重要なのは、どんな指標でも「真の能力」に対する誤差はつきものということです。問題はそれが定量的にどれくらいなのかです。
守備指標に比べて信頼性が高いとされる打撃の指標(例えばOPS)でも、1年間で必ず打者の真の能力と数値がぴたりと一致するものではありません。
1年分のUZRは完全にダメだけど3年分のUZRならば急に完全に信頼できるようになるわけでもなく、1年分のUZRには1年分のUZRなりの、3年分のUZRには3年分のUZRなりの信頼性があります。
ですから信頼性がある・ないの二分割で考えるのはそもそも無理ですし不適切ということです。
指標の信頼性はサンプルの量に応じて、またそもそも何を言おうとしているかの目的に応じて考える必要があります。
守備については、守備指標で全てを正確に表すことは到底できないけれども、守備指標で語れることも多い、というのが私の個人的な立場です。



Q.セイバーメトリクスの戦術論って平均で語るから意味なくない? 実際には個別の事情が多様なわけだから。

A.さまざまな状況を踏まえた解析ももちろんあります。
塁・アウト状況別の得点期待値だけでなくイニングも変数に含めた勝利期待値などは戦術を考える上で活躍しています。
また、投手と打者の個別の力関係を勘案して個別の期待値を算出することも可能であり、犠打はどのくらい貧弱な打者の場合有効か、といった研究もあります。
ただし原則として統計は集団を対象とするもので、個別事例に適用しにくいのは事実でしょう。
しかしそれに関しても、ケースバイケースとばかり言っていないで平均や全体の傾向を知ることも大事だということは言えます。
平均した数字だから個別とは関係ないと言うときに、本当に平均で対応できないと検証されたのかどうか。長期的には「長期的にはこうなる」という傾向に当てはまることから避けられないのも事実です。
頭の中で根拠なく「これは平均とは関係ない」と思っているだけなのではないか、ということには注意が必要ではないかと。


Q.監督を評価する指標はないの?

A.現状、直接的かつ包括的に監督を評価する指標は存在しないと思います。
ピタゴラス勝率と実際の勝率を比較して「戦力的にはもっと勝てているはず」などの評価を行う向きが一部にはありますが、私はこの評価法が監督の評価として意味のあるものだとは考えていません。
また別のやり方は犠打や盗塁の数など個別の戦術の要素を抜き出して「成功率が低いのに盗塁をさせすぎている」などの評価を与える方法ですが、これも監督が総合的にチームにどのような影響を与えているのかを教えてはくれません。



Q.精神論を否定していいの?

A.セイバーメトリクスは取り立てて精神論を否定してはいません。
精神論で語られているような側面がスポーツにおいて重要であることはセイバーメトリクス愛好家も全く否定しないところだと思います。野球は人間が行うスポーツですから。
むしろ当たり前に重要であり、その問題は結果的に優れたパフォーマンスを残せたか(良い記録を残せたか)に収束することから、直接にそれを取り上げて議論する必要がないということではないでしょうか。
否定しているとすれば「なんでもかんでも精神論で語ろうとする姿勢」かもしれません。従来精神論や「数字で表せないこと」として語られてきたものが、実は数字で合理的に説明できる例は多いです。
あるいは「流れ」などについても、プレーしている選手がそれを重視するのは自由ですが、語られてきたような効果が実際には発生していないことが事実として証明できる例もあります。



 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。