Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

WARを知るためのリンク集(主に英語)

『セイバーメトリクス・リポート2』において日本版が算出され、とうとう日本でも実際に活用できるようになった総合指標WAR。日本では馴染みがない指標であり、『リポート2』に一通りの解説は書かせていただきましたが、そうは言っても詳細について疑問点をお持ちの方も多いでしょう。

そこで、私自身がWARについて学んできて役に立ったウェブ上の文献を紹介してみようと思います。私も決してWARのマスターではなく勉強中の身であり、全てを知り尽くしているわけではないですから情報には偏りもあるとは思いますが、多少なり「WARについてもっと知りたいが何を読めばいいのかわからない」という方のお役に立てれば幸いです。

ただし、現状では残念ながら日本語で十分な情報がなく、詳しく知りたければ英語の情報にあたるしかありません。ここで紹介しているような内容について、部分的には日本語で当方のサイトに載せているところもあるので興味があれば見ていただければ。

本当に隅々まで探究していると果てしない時間がかかりますが、まず全体について知りたければ最初の「WAR全般」で紹介しているFanGraphsBaseball Referenceによる解説どちらかのシリーズをじっくり読んでいただければだいたい概要がわかると思います。読み進めていけばその中で詳しいリファレンスへのリンクも貼られているので、そこで納得できれば当方が載せたものを隅々までチェックする必要はありません。


※ここで書いているのはあくまで執筆時点(2013年4月)の情報で、WARの計算はどんどんアップデートされるのでご注意を。閲覧の時点によっては、WARの内容がここでの説明と変わっている可能性があります。新たに良いリンク先を見つけたり重要な改訂が加わった際にはこの記事を更新する可能性はありますが、情報が最新であることは保証しません。



WAR全般


How to calculate WAR

まずは、セイバーメトリシャンのTangotigerが「WARはこう計算するもの」と提唱した記事。
これは算出ロジックの提出であり、現在この方法に従って算出されたWARがどこで閲覧できるというものではありませんし、この記事では考え方について詳細な説明があるわけでもありません。しかしTangotigerは理論家として最も信頼に足る人物の一人であり多くのセイバーメトリクス研究において参照されていますし、ここで与えられている算出の骨格を見ておくことは重要です。当記事の以下でもTangotigerのブログの内容は多く紹介することになります。Tangotiger自身の記述だけでなくコメント欄でなされている議論(一流のセイバーメトリシャンが多数登場)も重要です。
また、ざっと流れを追えばなんとなくでもWARの数字についての計数的な感覚が掴めます。


What is WAR?

セイバーメトリクス情報サイトFanGraphsが算出しているWAR説明。ここからFanGraphsにおけるWARの算出方法を詳しく述べたシリーズ記事へリンクで飛べます。簡潔ながらある程度ステップ・バイ・ステップで丁寧に説明してあり、議論になるポイントなどもおさえてありますので参考になります。
また以下でも紹介していきますが、FanGraphsサイトにある用語集はWARに関連する指標や用語についても多数詳しく解説してあり、リファレンスとしては大変有用です。


WAR Explaind

WAR算出に関してはFanGraphsと両雄で、より詳細な計算をしているとも言えるBaseball ReferenceのWAR説明。
端から端まで全て読むと分量は膨大ですが、具体的な計算方法も明確に示してあり、その手順を自ら確認しながら読んでいくとWARについてかなり具体的な感覚として理解ができること間違いなしです。FanGraphsと算出方法が異なる主な部分について説明なども与えられています。





打撃評価


A Brief History of Run Estimation: Batting Runs

打撃を得点によって評価するBatting Runsという指標の紹介。
打撃の評価は、安打や四球など発生した出来事(event)に得点価値を与える形で行われます。打撃の評価は伝統的に数字を結果として受け止めることが親しまれており、それ自体に議論は生まれにくいです。なので、重要なのは塁とアウトの状況から実際に発生した得点の平均値という統計(得点期待値)を利用すること、それによって各打撃事象の価値が客観的に決まること、勝利は得点と失点で決まることから選手の働きを得点の観点で見るのが重要なこと、の理解がとにかく重要です。このような仕組みがLWTSと呼ばれるもので、それを打撃に適用して評価指標としたものがBatting Runsです。LWTSの理解は投手の評価でも守備の評価でも重要なので、抵抗が少なく直感的にイメージしやすい打撃の部分でしっかりおさえましょう。
日本語では当方のサイトの「基本的な考え方」の「得点期待値」の項でBatting Runsを説明しています。


Weighted On Base Average or wOBA

wOBAが発表されたTHE BOOKの抜粋。
WARにおける打撃の評価は、実質的には上記のBatting Runsです。しかし、様々な場面で活用される指標としてwOBAという便利なものをTangotigerが開発しており、FanGraphsやBaseball Referenceの算出ではこのwOBAを利用して最終的にBatting Runsの形式に換算する形で算出を行っています。wOBAはBatting Runsを打席あたりの「率」で表す指標にしたもので、LWTSの原理からwOBAを導出する過程が簡潔に書かれています。


The History of the wOBA, part 1

そして開発者のTangotigerによるwOBA開発の経緯や解説。なぜwOBAという指標が存在するのかやその意味についてより詳しく知りたいという場合はこちらをご参照下さい。





走塁評価


Ultimate Base Running Primer

FanGraphsのWARで採用されている走塁評価であるUBRの説明。得点期待値を使って得点化という意味で打撃評価の延長線で考えることができ、対象がベース上の動きで機会が打球になる点などロジックさえおさえれば特に難しくはありません。なおBaseball Referenceの走塁評価はWARの説明において算出法が明記されています。





投手評価


Defensive Responsibility Spectrum (DRS)

FanGraphsのWAR計算ではTangotigerが開発したFIPという投手の評価指標がベースになるのですが、そのFIPの紹介。かなり簡潔な記事で、これを読んだからすぐに理解ができるというものではないのですが、とりあえず開発者による記事はおさえておきましょう。


Evaluating Pitchers with FIP, Part I

一見すると雑にも感じられるFIPの式がどう導出されるのかについての数理的な説明。要するにLWTSで、守備の関わる部分(単打・二塁打・三塁打・凡打)が全ての投手について一定の割合で生じると仮定した計算をすればFIPになるというだけの話です。上記を参考にした日本語記事はこちら


Tango’s Lab: Deconstructing FIP

同じくFIPの数理について、考案者による記述。wOBAとの関連なども見えます。


Pitching and Defense

FIPの式の構造は上記でわかりますが、FIPで投手を評価することの理論的な妥当性については、結局のところ(本塁打を除く)被安打を投手の責任としないことに妥当性があるかに尽きます。これをBABIPの論点と呼びますが、セイバーメトリクスにおいて最も重要な論点のひとつであり、最も理解が難しい(というか誰も完全な答えを出せない)論点のひとつです。BABIPの議論を知るためにはいくつもの文献を読みたいところですが、まずは理論の提唱者であるボロス・マクラッケンの論文です。


Can pitchers prevent hits on balls in play?

マクラッケンによる「投手は本塁打以外の打球をコントロールできない」という主張に対して、いや完全にコントロールできないわけではない、という反論を提出した論文。長いですが一読に値します。


Solving DIPS

複数のセイバーメトリシャンがBABIPについて議論した論考。リンクはPDFファイルなのでご注意を。上記の「ヒットは運だ」「いや完全に運ではない」という議論に対して「最後は程度の問題だよね。では、どの程度?」という部分を具体的に分析しています。BABIPの高低の動きについて、どのくらいが運によるもので、どのくらいが投手の実力によるもので、どのくらいが守備力によるものか、についてのひとつの答えがわかります。


Infield Flies, FIP, and WAR

FanGraphsのWARは、当初普通に奪三振・与四死球・被本塁打という3要素のFIPを使って計算していたのですが、内野フライも守備力に関わらず確実にアウトカウントが増やすことができ走者も進めないことから、結果として投手の自力によるアウトの増加で奪三振に等しいと考え、内野フライを奪三振と同じように扱ってFIPを計算する形に改訂されています。


Pitcher WAR Calculations and Details

こちらはBaseball ReferenceのWARにおける投手評価の解説ページ。FanGraphsとBaseball ReferenceそれぞれのWARは投手評価の部分で大きく手法が異なっています。結果としてのチームの失点には投手の責任と守備の責任が混在しているわけですがFanGraphsのほうははじめから投手の責任だけの数字を抜き出してヴァーチャルな失点を組み立てる方式であるのに対し、Baseball Referenceにおいては全体の失点をベースとしてそこから守備の影響を除外するという方法をとっています。両方を知った上でどちらの方式が自分好みかを考えてみるのも面白いです。


Crucial Situations

リリーフ投手の評価には、登板した局面の重要度を評価するLeverage Indexという指標が関わってきます。そのLIについて、考案者であるTangotigerによる解説記事。





守備評価


UZR Primer

MGLによるUZRの概説。WARの守備評価はFanGraphsではUZR、Baseball ReferenceではDRSという指標をそれぞれ採用しています(これらは特殊なデータを必要とするためそれらのデータが得られない過去の期間については代替となるまた別の指標)。
UZRとDRSは異なる結果を出しはするものの基本思想は共通しており相関関係もあります。上記のMGLによる概説は計算方式や利用にあたってのポイントなどわかりやすく示してありますので、まずはこの記事でUZRをしっかり理解しておくとよいかと思います。


John Dewan (and research assistant) speak!

UZRとDRSの違いについて。


UZR

FanGraphs用語解説のUZR項目において、その他有用なリファレンスへのリンクも貼られています。





守備位置補正


Positional Adjustment

各守備位置ごとの評価となっている守備評価について、WARにするには異なる守備位置同士でその価値を比べるための補正値が必要となります。こちらは細かいデータを抜きにした概説。


Fielding Position Adjustments

Tangotigerによる守備位置補正についての初期の探究。複雑で手品のようにすら見えますが、非常に尊敬すべき研究です。算出のロジック確認に。


UZR positional adjustments, revised with 2008 UZR

ひとつ上の記事より時期的に後の、UZRを使った探究。コメント欄で現在使われる数字にあたる結論が出ています。


Paradox of the DH adjustment

ちょっと不思議な「DHの守備位置補正」について。


Historical Position Adjustments

守備位置補正を歴史的に見た論考。





リプレイスメント・レベル



Why Replacement Level?


なぜリプレイスメント・レベル(代替水準)という基準を用いるのかについて。なお、この点についてはKeith Woolnerによる「Introduction to VORP」という名論文があったのですが、現在ウェブ上から消えてしまって見れないようです。キャッシュの検索をすると見つかったりもするのでなんとかそちらを読んでみるというのもいいかもしれません。ざっくり日本語にしたものを当方のサイトに掲載しています。


The Official Replacement-Level Thread

Tangotigerがリプレイスメント・レベルを数量的に定義している記事。彼はリプレイスメント・レベルを勝率の形式で定義することを好んでおり、この方式は慣れるまではわかりにくく、どういう条件を設定して勝利を算出しているのかを注意深く見る必要があります。もし「ピタゴラス勝率」についてご存じない場合には、先にそちらを把握しておいたほうがいいかもしれません。


Replacement-Level Fielding

WARにおいてリプレイスメント・レベルの守備はリーグ平均と同一とされるわけですが、そのことが明快に示されるTangotigerによる分析。また、この記事のコメント欄ではさらに打撃も合わせてリプレイスメント・レベルの検討が行われており、個人的には(意外に根拠が不明瞭なリプレイスメント・レベルについて)極めて重要な議論がなされていると考えます。


The Replacement Pitchers

投手のリプレイスメント・レベルについて。なかなかトリッキーです。


Unifying Replacement Level

FanGraphsとBaseball Referenceは当初異なるリプレイスメント・レベルを採用しており、混乱の元となることも多かったのですが統一基準が設けられました。「30チーム162試合で得られるMLBの2430勝のうちWARを1000としてリプレイスメント・レベルを設定」といった言い回しははじめは慣れないかもしれませんが、数学的に複雑なわけではなく冷静に数字を追えばわかります(この一文からTangotigerが出しているような「リプレイスメント・レベルのチームの勝率」を自分で計算して導けると、周辺のロジックを理解している証拠と言えるかもしれません。ちなみに、答えは.294になります)。


Replacement level defined

直接WARの根拠になるわけではありませんが、Tangotigerとは少し違う角度から見たリプレイスメント・レベルの実証研究。





得点・勝利換算


Runs Per Win

WARは大部分の計算は得点数を単位として行われ、それが最後に勝利数に変換されます。具体的な操作としては、得点数を10あたりの数字で割るだけです(得点が10増えれば勝利が1増えるため)。このことについて述べて関連する項目へのリンクも貼ってあるウィキの項目。


Why 10 runs equals 1 win

どうして得点が10増えたら勝利が1増えるのかについて直観的に理解できる説明。





WARの解釈や活用


Misconceptions about WAR

FanGraphs用語解説より、WARの誤解されやすい部分について。


Misconceptions of WAR

Tangotigerによる誤ったWAR理解へのツッコミ。


WAR is the answer

有名どころであるESPNでもWARが取り上げられています。


My Answer to “I Don’t Like How Complicated WAR Is and How It Is Constantly Changing.”

やたらに複雑ですぐに計算方法が改訂されるからWARが信用ならない、という意見に対する反論。社会的に利用されているGDPと対比するとわかりやすく、指標の本質ではない表面上の操作や手続きだけを見た揚げ足取りの議論は生産的でないことがわかります。




スポンサーサイト

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。