Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

係数が大きかったらなんなのか

米国で生まれた指標を輸入する際、MLBとNPBの違いが問題になって有効性が疑われるということがあります。
例えば重回帰分析によって得点の貢献を評価するXRなどは、そのまま日本に適用すると過大な数字が出る傾向があることがよく知られています。
またBatting Runsのようにアウトの係数に補正をかけることで平均をゼロとするなら問題がないかというと、そういうわけでもないんですね。
まぁ現実的には、指標の有効性がそれほど損なわれることはないと思っていますが、具体的にそれが解析においてどのような意味を持つのか、その構造を理解しておくことは重要です。


Batting Runsというのはポジティブな攻撃イベントの係数だけが固定されており、その上で年度・リーグごとにアウトの係数を変えることにより全体をゼロとして使用する指標です。
ものすごく単純化してこのことの図式だけを示すと

 Batting Runs=0.50×出塁数-アウトの係数×アウト数

というふうになります(仮に出塁全体の係数を0.50とした場合)。
このときリーグの平均出塁率が.333であれば、平均をゼロとするために2回のアウトで1回の出塁を打ち消す0.25がアウトの係数となります。

ところでBatting Runsの係数というのは得点期待値に基づくものですから本来リーグの状況によって変わるものです。
基本的に得点の多いリーグでは係数が全体的に「大きく」なります。
出塁が多いとヒットが点に繋がりやすいわけですから出塁の(ポジティブな)係数が大きくなるのは自然ですし、そうするとアウトの係数もそれを打ち消すために必然的に大きいマイナスになります。

ここで、あるリーグに他のリーグから0.50の係数(という出塁の係数だけ)を持ってくることを考えます。
このとき0.50という係数がリーグの実情に合えば当然それで問題はありません。しかし例えばリーグの実情では係数としては実は0.45が適当であるような場合には少し問題が起こります。
そしてリーグの平均出塁率が.330だとすると、リーグ内の実態としてはアウトの係数は-0.22であるべきです。
しかし出塁の係数0.50を持ってきてしまっているので出塁率.330の打者をゼロとするためにはアウトの係数は計算上-0.25になります。

何が問題なのでしょうか。平均的な打者は、係数がどうだろうがどうせ評価はゼロになるように定義されているので関係ありません。
問題は、「アウトにならずに出塁することの価値」が過大に出力されることにあります。
リーグ内の実態としてはその価値は出塁0.45とアウト-0.22の差である0.67であるはずが、計算上0.50と-0.25の差である0.75となってしまいます。
出塁率.350の打者であれば500打席あたりで.330に比べて多く出塁する回数は10回であるので利得(Batting Runs)は本来6.7。しかし計算上は7.5。
他から係数を借りてくるときの「スケール」の問題はシンプルに言えばこの差異です。コンポーネントごとの加重の違いは別の話。
この誤差は平均に比べて出塁する頻度に差があるほどに積み重なってくるため、強打者であれば平均と比べての得点への影響を過大評価するようなことに繋がります(例えば今回の方式の試算で、出塁率4割の打者では500打席で2.6点の誤差となります。ただし今回の設定はなんらリアルな統計データと関係はありませんが)。

能力の極端な打者ほど数字の歪みが大きくなるというのはRCなんかでも聞いた話のような気がしますね。この点について補正に取り組むにしろ放っておくにしろ、癖は把握しておきましょうというお話です。
あまり整理されないまま長々と書いてしまいましたが、きっとこれが今後に繋がったり繋がらなかったりします。

コメント

使用球の統一で得点環境の調整は比較的容易になるんでしょうかね。
贔屓球団を持ってる身としては不安を交えつつという感じですが
来季は色んなものが白日の下に曝されるシーズンになるのかな、という気もします。

>Sibierskiさん

使用球の統一はどう出るのかはっきりはしませんよね。条件の極端な偏りはなくなる可能性が高いんでしょうけど、それがペナントに効果としてどう出るのか。阪神は大丈夫な気がしますが。

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/456-b85f1fa1

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。