Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

得点効率の見積り

チーム単位での「得点/XR」の計算が、得点効率を計るひとつの方法として知られていますけど
最近ちょっと疑問だったりもします。
もちろん、簡易的な方法として一定の合理性を持って行われていることに関して文句は全くないのですが
犠打犠飛の扱いとかNPBに当てはめると大きめの数字が出がちとかいうことを除いても
細かく言うとXRって、数字の性格からして、そういう用途に合うのかなぁと。
XRの係数は回帰の元の中で最も当てはまりの良い値であって、野球の仕組みを考えるとチームの打撃レベルに応じて真実の中の係数は変わるんじゃ。

ちょっと色々考えてこんがらがってるんでざっくり言うと、例えばよく打てるチームならイベントひとつあたりの得点寄与はXR(全体の平均)の側から見ると自然と上がってきて、単純に得点の多いチームは得点効率が良いように出るんじゃないかってことです。
でもその打撃レベルの中で言うと実は効率は普通なのかもしれない。
「得点効率」を「当該の打撃イベントが揃った場合に見込まれる平均的な得点に対する上積みの多さ」っていうふうに考えた場合です。
XRが「当該の打撃イベントが揃った場合に見込まれる平均的な得点」かというと、厳密に言うとちょっと違うんじゃないかと。
高い合理性をもって近い値は出せるけれども、加算式の限界としてどうしても平均的な範囲の見積りをしてしまい回帰元のデータと傾向がズレてくればくるほど現実と違ってしまうなら
得点の高いチームを過小評価して、低いチームを過大評価して、結局のところ「得点/XR」は概ねただ単に得点の高低を見ることになってしまうのではと。
合理的に得点予想をするにはXRは非常に有用ですが、得点効率を計る際の対象にするには少し論理的な問題を生む気がします。
回帰分析についてほとんど勉強もしてませんし見落としもありそうなんでアレですけども。

そんなこんなで、得点効率を推し量るための比較対象には理想的にはシミュレーションモデルでも使ったほうがいいんじゃないかと思ったりするわけです。
RC(乗算式)はRCで高い打撃レベルの際に過大評価した見積りを出すとか言われますしね。
Base Runsとかいうのは勉強中ですが、これはチーム単位の指針としてはいいのかも。
ざっとここ16年ほどのNPBに当てはめてみると、犠打とか犠飛とか併殺なんかの項目を含まないわりにXRと同等の実得点に対する相関を見せます(※1)。
得点効率の比較対象にするならXRよりベターかもしれません。
ただ「得点/XR」も「得点/Base Runs」も示す傾向はほとんど同じなので些細な問題かもしれませんけどね。



※1……今回相関とった範囲での係数はXR .966、Base Runs .965ですが、チーム単位の得点との相関だけなら結構適当な式でも出るんですよね。
塁打で.896、塁打+四死球で.949。試合あたり平均得点とOPSで.940。
総合指標の「答え合わせ」はこうしてチームレベルの結果で行われますが以上を見てわかるようにチーム単位でそれなりの当てはまりを見せるからといってそれを個人に適用する場合の妥当性まで保証されるかというとそれは違うと思います。
塁打+四死球が積み上げの評価としてOPSの代用になるかというと、本塁打の価値が単打の4倍というのはおかしいだろうとすぐに気がつきますからね。
チーム単位ではなんだかんだ言っても出塁率:長打率がそんなに偏ることはありませんけど個人では大きく偏ることもありますのでそこに対応できるかどうか、OPSとGPAの違いもやっぱりそこだと思います。
しっかし、恥晒すだけなので統計の素人があんまり深入りしないようにしようとは思いますが(汗)

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ