Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

WAR改善に向けた話

『セイバーメトリクス・リポート』『セイバーメトリクス・マガジン』などを発行しているDELTAが2012年、2013年と算出しているWARについて、今後の改修に向けた議論をしたいと思います。
はじめに断っておきますがここでの議論は何らDELTA関係者としてのオフィシャルなものではなく、単なるセイバーメトリクス好きとしてこう変わっていってくれたらいいなぁという検討です。

以下、アメリカのバージョンと区別するためにDELTA社算出のWARをdltWARとします(これも何らオフィシャルな呼び方ではないので注意)。特に挙げている順番に意味はないです。



#1 投手評価をFIPからtERA(tRA)に

個人的には前々から是非ともと考えていたところで、結果的な貢献度の評価指標としてはFIP(BABIPの高低完全無視)よりもtERA(発生した打球の種類までは投手の責任)のほうが望ましいと考えます。SMM2でも打球種別の得点価値が出ており既に日本でtERAの算出自体はできるわけですので、これは単純に置き換えればいいだけかと。


#2 パークファクター補正の導入

いわゆる統一球うんたらかんたらで現在特に取り扱いが難しいところではありますが、投打ともにパークファクターに関する補正はやはり外せないところかと思います。意外とアメリカのサイトや文献でここの計算式をきちんと示しているところって少ない(みんな細かいところは興味ない?)のでどうするか迷う部分も少しありますが、先日整理してみたような形かあるいはplay-by-playデータを使っていいなら、自分は以下のようにやるのもわかりやすいかなぁと考えています。

打者の補正値(wOBAから減算):(ホームでの打席/打席)×(ホームでの両軍合わせたwOBA-ビジターでの両軍合わせたwOBA)

投手の補正値(tERAから減算):(ホームでの対戦打席/対戦打席)×(ホームでの両軍合わせたtERA-ビジターでの両軍合わせたtERA)

これだとよく言われる得点価値の補正に直接的にはならないのですが、得点を直に扱うよりコンポーネントのほうが数が多いので仮に1年だけで見ても相対的に安定した数字が得られると考えられること、リアルな得点をねじ込むよりWARで測定の対象としている指標でPFを測ったほうが論理がスッキリすること、に魅力があると考えています。たしかColin WyersがどこかでこういうリニアなPFの計算を議論していたと思うのですがちょっとどのサイトだったか思い出せず。もちろん得点を試合数で割るやつで普通にやっても全然問題ないのですが。


#3 日本版守備位置補正値の算定

現在dltWARではfWARで利用されている守備位置補正値を少し修正して使う形となっています。守備位置補正の対象となる実態はおそらくMLBとNPBで大勢は変わらないものの同一ということはないと考えられるため、日本に合わせた補正値を出すことが望ましいと言えます。

fWARはTangotigerが守備指標から「捻り出した」補正値を使っていますが、日本では打撃指標の側から補正値を導き出すしかないでしょう。実際的な事情としては打撃指標から補正値を導くのはよくある話ですし、MLBの結果で照らす限りは数字自体そう違ってこないことはわかっています。

このあたりを正当化する理屈としては(荒いのであまり引っ張り出したくないですが)以前このブログで総合評価をする際にも議論していますし、Bill JamesもThe Fielding Bible 2で打撃指標を使った守備位置補正値を出して総合評価に使用しています。またTangotigerのブログでも最近議論があったところで、守備指標からやるべきだという主張ももちろん理解できますが、個人的には守備指標からやるのは理論的には望ましくても実際問題強引になりがちなので打撃指標を使っておくのは必ずしも妥協ではなく積極的な選択でもあり得るかなと考えています。

どのくらいの期間を対象にとって補正値を計算するかですが、一部の選手のパフォーマンスに影響されず一般的な法則のようなものを出したいので、20~30年くらい見たほうがいいのかなと思います。要するにコレなんですが、日本のデータでは外野手を区別して計算するのが最近の数年しかできないんでしたかね。


#4 リリーフ評価にレバレッジを導入

理屈付けに関してはこのブログでも少し議論してきたところですが、リリーフの特性を考えると現在MLBで行われているWARに(LI+1)/2のボーナスを与えるのはまぁ妥当なところだと思います。問題はLI(WE)の数字をどうやって出すかで、個人的には正直ちょっと手に負えないところ。


#5 ベースランニング評価の追加

現状は盗塁・盗塁刺だけの評価となっていますが、走者として安打の間の進塁なども評価されるとより包括的な評価となります。要するにコレができればいいという話で、あとはもうどこまで細かく項目を入れるかだけです。得点としてのインパクトは小さいですし、手間はかかりますけどね……。


#6 UZRのリーグ合計をゼロに

以前からこの辺はどうするべきなのかと思案していたところなのですが、個人的にはdltWARに使われているDELTAによるUZRを特定のリーグ・守備位置について合計したときにゼロにならないのが気になります。パフォーマンスの良し悪しそれ自体ではなくwRAAなどのように相対的な利得の大小を表すRelative系スタッツの性格上「リーグ平均値=0」の性質は外せないかと。

FanGraphsのUZRでは各ゾーンのアウト率の算出は過去6年のデータに基づいているということで、30球団162試合のMLBですら十分に大きなサンプルを確保するために6年のデータ必要ということなのでNPBでもゾーンの基礎データはできるだけ多くのサンプルを集めることが好ましいでしょう。

で、FanGraphsのUZRは6年分の基礎データを使って算出したUZRをその年・リーグの平均が正確にゼロになるように調整しているということですが、そこの計算ロジックは書かれていません(見逃しているだけでどこかに書いてあるのかな?)。というのもwOBA→wRAAを計算するときの打席数にあたるものが必要になるのですが、それが何なのか。BBTFの記事を見るとMGLはUZRにおける「機会」を「獲得アウト数+許安打の責任分」と定義している(player's "chances" in any particular zone is defined as that player's number of outs plus the number of hits he is responsible for. )のでおそらくそういう類の数字を使っているものを推測します。日本でもこれを求める必要があるのでしょう。自分はSMM2の分析でUZRをノーマライズする際、打球ごとに平均的に見込まれる守備位置ごとのアウト獲得数を機会として集計しました。計算は少し違いますが結果はそう変わらないと思います。

ただFanGraphsのデータを見てみるとAL・NLそれぞれでUZRを合計したときにゼロになるわけではなくMLB全体でゼロになるようになっていて、この辺の思想はよくわからないです。平均をセパ合計でとるにしろ分けるにしろ「基礎データを複数年で取って、それから平均をゼロに合わせる」仕組みは必要だと思うのですが、どうも自分が何か勘違いしているところがあるのかなぁ。


#7 打撃評価の解像度向上

このあたりはモデルとして決定的ではなく影響も少ないマイナーなところですが、個人的にBaseball Referenceがやっている「内野安打と外野安打の区別」とか「併殺打回避得点」など一般的なwOBAの式より細かく打撃の内容を見る計算はある程度は重要だし筋に無理もなく、もしデータが出せるなら計算もさほど複雑にならないので好ましいと考えています。併殺打のほうは最高と最低で10点くらい差がつくということですから、本来無視はできないところです。





以上思いつくままに挙げてみました。あとはリプレイスメント・レベルの設定が本当に今のままでいいかとか検討すべき点はあるのですが、多分その辺は掘っても何も出ないというか、計算結果は変わらなさそうな気がしています。


コメント

守備位置補正その他

日本でセイバーの議論をするフォーラムみたいなものがどこにあるのか分からないので、こちらで質問します(BaseballLAB再開しないですかね)。

1.前から疑問だったのが「守備位置補正は守備成績に対する補正なのか攻撃成績に対する補正なのか」です。
一般的な説明では「Posの違う選手同士の守備成績の直接比較はできないから補正する」ということですが、「その選手がいない場合の代替選手の打力はPosごとに違う。Cの控えと1Bの控えが同じリプレイスメント・レベルのはずがない」と考えれば、攻撃に対する補正とも言えます。BRでは攻撃WARと防御WARの両方に補正を加えて「oWARとdWARを足してもWARにならない。Pos補正を二重に数えることになるから」と説明してますが、何かスッキリしません。

2.BRやFGは、野手全体のWARと投手全体のWARが一定の比率になるよう調整してたと思いますが(年俸比率か何かで)、dltWARではそういう調整はしてますか?

3.リリーフをレバレッジで補正するとして、(LI+1)/2にする理論的根拠はないですよね?
FGも「大体こんなもんで」で決めたと思うので、これもスッキリしないところです。

4.盗塁も、FGのwSBように盗塁機会を分母にした質×量の形の方が合理的じゃないでしょうか。と言っても、最終的に出てくる数字はほぼ変わらないだろうし、分母をどうするかも難しいですが。

5.質問じゃないですけど、BRの併殺回避得点は「ゴロを打ってから一塁までマジメに走る度」なので、ぜひ評価に加えてほしいですね。

>APさん

こんにちは。セイバーを議論するフォーラム……自分が知る範囲では、ガッツリなものはないですね。
私も全然ブログ書けてないので、もっと議論を活発にしないとですね。

1.少なくともTangotigerが(原則として)守備指標から導出した補正値を用いているfWARに関しては、守備指標を守備位置を跨いで評価するための補正という位置付けになると思います。またWARはパフォーマンスの優劣自体は全て平均を基準として行い、最後に平均と代替水準との差(走攻守全てを含めた差)を足すというフレームワークになっています。その流れを考えると、そもそもがリーグの野手全体での比較になっている打撃指標に、野手全体で比較ができるよう補正をした守備指標を足す(→守備位置に関係なくリーグの野手全体で平均に対する攻守の比較ができる)、という考え方はすっきりしていると思います。ただアメリカの議論でも守備位置補正の理論的な基礎ってどうもぼんやりしている気はします。

2.dltWARでは投手と野手のWARの比率をフィックスで決めることはしていません。野手のリプレイスメントはwOBAで平均の0.88倍、先発投手は失点率で平均の1.39倍、救援投手1.34倍、という形で評価をして結果的にWAR合計が求まる形です。

3.計算式そのものの「理論的根拠」はないですね。評価にあたって局面のLIをそのまま使うのではなく平均値に近づけることの理由はご存じの通りTangotigerが「chaining」と説明しているものですが。
http://www.insidethebook.com/ee/index.php/site/comments/valuing_relievers/#6
理想的にはコンテクストの仮定として合理的な数字を統計から求めてそこから関数を作るような形にできればいいのでしょうが、細かくやろうと思えばひどく複雑になるわりに、例えばLI 1.8を調整で1.43にすべきか1.38にすべきかというところを議論してもほとんど結果に影響がない、というのが「(LI+1)/2」で済まされている理由だと思います。ただでさえ年間で極端にLIが偏る選手自体少ないですし。(理論的に存在するはずの)複雑な関数を簡単な形で近似したものなんだと言われれば、個人的には大きな問題はないように思いますがいかがでしょうか。

4.ご指摘の点含めて走塁関係は現状簡易的な形なので、よりきめの細かい形にできれば望ましいですね。

5.さすがにB-Rは細かいので見習いたい点が多いです。

算出ロジックの議論はWARだけでなくセイバーメトリクスの普及にも繋がると思うので、こういう議論は興味深いです

・tERAについて
個人的にFIPは投球結果と投球内容の丁度良い妥協点かな、と考えていますが、実際にtERAに置き換えた場合どのように変化するか、というのは気になりますね
FanGraphsがWARに導入しない理由も見えてくるのでしょうか

・パークファクターについて
PFに関しては地方巡業が多いNPBならではの課題もありますね
補正に使うPFを数年分で平均化する時に、地方球場の扱いが難しそうです

・FanGraphsのUZRについて
FanGraphsではFIPの補正値をMLB全体の防御率に合わせているので、UZRが先かFIPが先か自分はちょっと判らないですが、この方式のFIPに対応させるならUZRもMLB全体で評価する方が適当なのかなと
交流戦がある以上はリーグ間で勝利数に格差が生まれてしまうので、全ての貢献度を完全に各リーグ平均に合わせた場合に発生するズレへの対処は難しくなりますね
NPB全体を対象とするにせよセパで分けるにせよ、仰られるように基準点が0になるような調整は必要だと思います

>SOSさん

コメントありがとうございます。
WARの議論をするというのは結局貢献度の評価全体を議論するのと同じことなので広がりがありますよね。

tERAについては結果は大して変わらないはずです。
なるべく精緻なWARを構築するということを考えたときに、変な話、さすがに打席の約7割を「無視」するFIPよりtERAのほうが納得感が高いだろうという観点も個人的にはあります。tERAの難点については打球種の分類をどうするかに恣意性が入るという点くらいしか思い浮かびませんが、どうしてFanGraphsがやらないのかは以前から不思議です。不勉強なだけでしょうか。

地方巡業や交流戦はまことに仰る通りで、データ上非常に鬱陶しい(失礼)ところです。ただ、交流戦なんかはあくまでも一部に過ぎませんし、非常に多くの人がUZRといった指標を「+5で守備は問題なかった」というように平均(これがどういうふうに受け止められているかはかなり怪しいものの)という基準を参照しながら使っていることを考えると、仮にその守備位置の平均が+6だったりするとペナントレースの意味(相対的な勝ち負け)や指標の理論的枠組みとしておかしいだろうとどうしても気になってしまいます。

セイバーメトリクスの守備指標にはUZRとDRSの二つがあるのでどちらも測定したほうがいいのではないでしょうか?
たまにこの二つの数字が大きく異なる選手もいますがどっちの指標がより正確に守備力を測れるんですか?

>aaaさん

両者はコンセプト的に似通っていますし、どちらが正しいかは微妙なところですね。
ひとつよりはふたつあるほうが参考になると言えばまぁそうだろうと思いますが
とりあえず既存のモデルがあるから当てはめて算出してみるというよりは
自分たちなりにロジックを考えて望ましい守備評価を練っていくことも重要かなぁと思います。

WAR改善の話ではないですが…
マガジン2のwRARという打撃指標は何を表しているのですか?

>あんさん

返信遅くなりすみません。マガジン2お買い上げありがとうございます。
wRARですが、文字面と値からして「平均的打者に対する上積み」を示すwRAA(weighted runs above average)に対して「リプレイスメント・レベルの打者に対する上積み」を示すものではないかと思われます(wRAR→weighted runs above replacement)。

控えレベルの打てない打者を出すよりは、その打者が打ったことによって、チームの得点がこれだけ増えているよ、ということを表す指標ですね。
平均的な打者とリプレイスメント・レベルの打者が生み出す得点はシーズンで20点くらいの差がありますので、楽天のAJであればwRAAが29.9であるのに対してwRARは48.8と、だいたいフルシーズン出場した打者についてはwRARがwRAAより20点くらい大きくなるという関係になります。

併殺回避の得点化に際し、詳細なスタッツが得られない場合の簡易算出式を考えてみたんですが、どう思いますか。

wDP=(lgDPrate*(AB-H-K)-DP)*0.44
lgDPrate=lgDP/(lgAB-lgH-lgK)

0.44はB-Rを参照。
単純にPAを分母にするのではなく、三振以外のアウト打席のうち併殺になる割合で評価します。
難点は一番打者の過大評価と、Batted Ballのゴロ率の個人差が大き過ぎることでしょうか。

>APさん

返信遅れてすみません。
play-by-playデータが使えないとして、仕方なく凡打に一定分を見込むわけですね。
ロジックは明快ですし、(併殺打が変数に入った)RCを計算するときのようにただ単に併殺打の数だけマイナスするよりは優れた計算であることは明らかだろうと思います。
ただ、結局(制約により)状況は考慮できないわけですので、あとは実際にplay-by-playデータを考慮して計算する場合に対してどれだけの精度の近似になるのかという「程度」の問題になるのではないでしょうか。
近似の程度が芳しくないとしたときに、それでも無視をするよりはいいと考えるか、バイアスが大きいなら不公平が出るから併殺打を無視したほうがいいと考えるかは好みが分かれそうですね。

俊足代表イチロー、普通代表ジーター、鈍足代表プホルスの2001-13の数字でやってみたら、B-Rの併殺回避得点より分布が極端に広がってしまいました。
打順などで併殺機会の個人差が大きすぎるのでこのままでは精度が悪くて使えません。

>APさん

ブログ更新してなさすぎてコメントが承認待ち状態になってしまっていました。申し訳ありません。
分布が極端に広がってしまうのは致し方ないでしょうね。
データが限られている中でなんとかベターな計算方法を探る姿勢としては個人的にすごく好きなのですが、やはり精度としては無理があるという形になってしまいますでしょうか。

2009-2012MLB、シーズン300PA以上の打者(延べ1084人)で検証したらこうなりました。

RDP1 DP率の分母PA
RDP2 分母AB-H-K
RDP3 分母AB-HR-K
RDP4 分母AB-XBH-K

B-Rの併殺回避得点(整数)との相関係数と誤差RMS
RDP1:0.787 0.871
RDP2:0.801 0.844
RDP3:0.808 0.831
RDP4:0.809 0.829

(誤差RMSが最小になるDPの得点価値=0.24として計算)

まず併殺打が機会云々の前に個体差で傾向が分かれるだけあって、相関は出るんですね。
それでいて、分母の修正はさほど効果をもたらさないと。
結局、細かいデータを使って計算する場合の傾向は掴めるわけで、その意味ではご指摘のような形で併殺打をマイナス項目として評価に加えてもいいように個人的には思いますが、最終的には各自の価値判断になってしまう感じですかね。

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/556-8752811a

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。