Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

WAR改善に向けた話

『セイバーメトリクス・リポート』『セイバーメトリクス・マガジン』などを発行しているDELTAが2012年、2013年と算出しているWARについて、今後の改修に向けた議論をしたいと思います。
はじめに断っておきますがここでの議論は何らDELTA関係者としてのオフィシャルなものではなく、単なるセイバーメトリクス好きとしてこう変わっていってくれたらいいなぁという検討です。

以下、アメリカのバージョンと区別するためにDELTA社算出のWARをdltWARとします(これも何らオフィシャルな呼び方ではないので注意)。特に挙げている順番に意味はないです。



#1 投手評価をFIPからtERA(tRA)に

個人的には前々から是非ともと考えていたところで、結果的な貢献度の評価指標としてはFIP(BABIPの高低完全無視)よりもtERA(発生した打球の種類までは投手の責任)のほうが望ましいと考えます。SMM2でも打球種別の得点価値が出ており既に日本でtERAの算出自体はできるわけですので、これは単純に置き換えればいいだけかと。


#2 パークファクター補正の導入

いわゆる統一球うんたらかんたらで現在特に取り扱いが難しいところではありますが、投打ともにパークファクターに関する補正はやはり外せないところかと思います。意外とアメリカのサイトや文献でここの計算式をきちんと示しているところって少ない(みんな細かいところは興味ない?)のでどうするか迷う部分も少しありますが、先日整理してみたような形かあるいはplay-by-playデータを使っていいなら、自分は以下のようにやるのもわかりやすいかなぁと考えています。

打者の補正値(wOBAから減算):(ホームでの打席/打席)×(ホームでの両軍合わせたwOBA-ビジターでの両軍合わせたwOBA)

投手の補正値(tERAから減算):(ホームでの対戦打席/対戦打席)×(ホームでの両軍合わせたtERA-ビジターでの両軍合わせたtERA)

これだとよく言われる得点価値の補正に直接的にはならないのですが、得点を直に扱うよりコンポーネントのほうが数が多いので仮に1年だけで見ても相対的に安定した数字が得られると考えられること、リアルな得点をねじ込むよりWARで測定の対象としている指標でPFを測ったほうが論理がスッキリすること、に魅力があると考えています。たしかColin WyersがどこかでこういうリニアなPFの計算を議論していたと思うのですがちょっとどのサイトだったか思い出せず。もちろん得点を試合数で割るやつで普通にやっても全然問題ないのですが。


#3 日本版守備位置補正値の算定

現在dltWARではfWARで利用されている守備位置補正値を少し修正して使う形となっています。守備位置補正の対象となる実態はおそらくMLBとNPBで大勢は変わらないものの同一ということはないと考えられるため、日本に合わせた補正値を出すことが望ましいと言えます。

fWARはTangotigerが守備指標から「捻り出した」補正値を使っていますが、日本では打撃指標の側から補正値を導き出すしかないでしょう。実際的な事情としては打撃指標から補正値を導くのはよくある話ですし、MLBの結果で照らす限りは数字自体そう違ってこないことはわかっています。

このあたりを正当化する理屈としては(荒いのであまり引っ張り出したくないですが)以前このブログで総合評価をする際にも議論していますし、Bill JamesもThe Fielding Bible 2で打撃指標を使った守備位置補正値を出して総合評価に使用しています。またTangotigerのブログでも最近議論があったところで、守備指標からやるべきだという主張ももちろん理解できますが、個人的には守備指標からやるのは理論的には望ましくても実際問題強引になりがちなので打撃指標を使っておくのは必ずしも妥協ではなく積極的な選択でもあり得るかなと考えています。

どのくらいの期間を対象にとって補正値を計算するかですが、一部の選手のパフォーマンスに影響されず一般的な法則のようなものを出したいので、20~30年くらい見たほうがいいのかなと思います。要するにコレなんですが、日本のデータでは外野手を区別して計算するのが最近の数年しかできないんでしたかね。


#4 リリーフ評価にレバレッジを導入

理屈付けに関してはこのブログでも少し議論してきたところですが、リリーフの特性を考えると現在MLBで行われているWARに(LI+1)/2のボーナスを与えるのはまぁ妥当なところだと思います。問題はLI(WE)の数字をどうやって出すかで、個人的には正直ちょっと手に負えないところ。


#5 ベースランニング評価の追加

現状は盗塁・盗塁刺だけの評価となっていますが、走者として安打の間の進塁なども評価されるとより包括的な評価となります。要するにコレができればいいという話で、あとはもうどこまで細かく項目を入れるかだけです。得点としてのインパクトは小さいですし、手間はかかりますけどね……。


#6 UZRのリーグ合計をゼロに

以前からこの辺はどうするべきなのかと思案していたところなのですが、個人的にはdltWARに使われているDELTAによるUZRを特定のリーグ・守備位置について合計したときにゼロにならないのが気になります。パフォーマンスの良し悪しそれ自体ではなくwRAAなどのように相対的な利得の大小を表すRelative系スタッツの性格上「リーグ平均値=0」の性質は外せないかと。

FanGraphsのUZRでは各ゾーンのアウト率の算出は過去6年のデータに基づいているということで、30球団162試合のMLBですら十分に大きなサンプルを確保するために6年のデータ必要ということなのでNPBでもゾーンの基礎データはできるだけ多くのサンプルを集めることが好ましいでしょう。

で、FanGraphsのUZRは6年分の基礎データを使って算出したUZRをその年・リーグの平均が正確にゼロになるように調整しているということですが、そこの計算ロジックは書かれていません(見逃しているだけでどこかに書いてあるのかな?)。というのもwOBA→wRAAを計算するときの打席数にあたるものが必要になるのですが、それが何なのか。BBTFの記事を見るとMGLはUZRにおける「機会」を「獲得アウト数+許安打の責任分」と定義している(player's "chances" in any particular zone is defined as that player's number of outs plus the number of hits he is responsible for. )のでおそらくそういう類の数字を使っているものを推測します。日本でもこれを求める必要があるのでしょう。自分はSMM2の分析でUZRをノーマライズする際、打球ごとに平均的に見込まれる守備位置ごとのアウト獲得数を機会として集計しました。計算は少し違いますが結果はそう変わらないと思います。

ただFanGraphsのデータを見てみるとAL・NLそれぞれでUZRを合計したときにゼロになるわけではなくMLB全体でゼロになるようになっていて、この辺の思想はよくわからないです。平均をセパ合計でとるにしろ分けるにしろ「基礎データを複数年で取って、それから平均をゼロに合わせる」仕組みは必要だと思うのですが、どうも自分が何か勘違いしているところがあるのかなぁ。


#7 打撃評価の解像度向上

このあたりはモデルとして決定的ではなく影響も少ないマイナーなところですが、個人的にBaseball Referenceがやっている「内野安打と外野安打の区別」とか「併殺打回避得点」など一般的なwOBAの式より細かく打撃の内容を見る計算はある程度は重要だし筋に無理もなく、もしデータが出せるなら計算もさほど複雑にならないので好ましいと考えています。併殺打のほうは最高と最低で10点くらい差がつくということですから、本来無視はできないところです。





以上思いつくままに挙げてみました。あとはリプレイスメント・レベルの設定が本当に今のままでいいかとか検討すべき点はあるのですが、多分その辺は掘っても何も出ないというか、計算結果は変わらなさそうな気がしています。


スポンサーサイト

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。