Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

UZRの基礎データを複数年でとることについて

『デルタ・ベースボール・リポート1』掲載の岡田さんによるUZRの複数年化の検討を読んでいます。データを見るとほどほどに結果の差がありますね。

岡田さん(デルタ)としての方向性は記事を読んでいただければわかりますが、ここでは自分なりの考えを書いてみたいと思います。結論から言えば、自分はかねてから「打球の基礎データは複数年でとって最終評価値は単年リーグ内ゼロサム」派です(過去の記事も参照)。

この問題は、例えば1ヶ月のプロ野球のデータだけから算出した得点期待値で計算したLWTSで打者の得点ポテンシャルへの貢献をうまく反映できるかという問題に似ている気がします。あるプレーが一般的なポテンシャルとしてこれだけの価値があるものである、というのを算出するためにはサンプルサイズが必要かなと。

例えばシーズン中にある種の難しい(より長いタームで見ればアウトになる確率が低い)打球が守備者Aのところにばかり集中して飛んで、Aがなんとかそれを全部アウトにしたとすると、その打球は簡単な打球と判定されてAには加点がない(少ない)ことになります。

それでいいんだという立場もあり得るかと思いますが(他の期間を見てどうだろうがそれがその期間の実態といえば実態ですから)、対象の選手が出場することによってチームが得た勝利ポテンシャルを評価するWAR的な観点からすればUZRはそこを加点して評価すべきと考えます。

より極端に言うと、1週間の結果的な守備貢献を評価しろと言われたとして、打球の基礎データも1週間のものを使うかという問題に置き換えてもいいかと思います。自分はこれを否定する立場です。そうすると話を1年に引き伸ばしたとしても、サンプルが足りないと思えば基礎データはもっと必要だという話になります。

1年間のプロ野球全体ですから打球の数はたくさんあるようにも一見思えますが、実際にはUZRでは打球を種類・位置・速度で細分化していきますからひとつひとつの「バスケット」に入る打球の数は1年では案外少ないです。じゃあ3年必要なのか5年必要なのか、という適切な期間の話はそれはそれでまた議論が要るかと思いますが。

結局はその時々の実態を反映させることとサンプリングの誤差を排除することとのトレードオフであって、WARの算出に関係するもので考えてみると得点期待値であれパークファクターであれ守備位置補正値であれ、サンプルを確保するために複数年のデータをとっているものはいくつもあります。自分はUZRの打球データも同じで1年では心許ないものだと思っております。

また、最終値のリーグ内ゼロサムはリーグ内で利得をやりとりして優勝を争っている以上当然かなと。

スポンサーサイト

守備指標がさらされる目線

守備指標がさらされる目線についてふと考えて、ツイッターに書こうと思ったのですが長くなったのでこちらで。


守備指標の妥当性がいつも厳しい目にさらされるのは、指標自体の性質云々より、一般に守備について数字を結果として受け入れる慣習がないという要因が大きいと思います(そのことの良し悪しは別として)。

打率は.298と.300の差であっても、それが統計学的に見て注目に値するものでなかろうが、「彼が三割打者になるために足りなかったのは何か」などと、数字を結果として厳粛に受け止めたうえで中身は中身で考えるという慣習があります。

「阿部はすごく技術がある名打者なのに.250になるなんて、打率とかいう指標はおかしい」とは言いません。結果は結果です。

これに対して守備については何故か、プレーの内容としての上手い・下手の評価ありきで、指標の数字がそれに合わないと指標の中身が怪しまれます。打撃とパラレルに考えれば、(潜在的な)能力として上手いとされる選手であっても、ある期間の打球の処理の結果がたまたま芳しくないということがあっても「指標がおかしい」となる必然性はないはずです(スイングのいい打者の打率が低くても「打率が指標としておかしい」わけではないのと同じ)。もちろん、主観的な評価の方が適切である保証もありません。

言い方を換えれば、主観的には守備が上手いと思うのに指標の結果が悪い、というのは、矛盾する結果ではないので主観と指標のどちらかを否定する必要もなく、単にそれらがどのような関係にあるのかを整理すれば済む話です。くどいようですが強打者でも打率が低いシーズンがあっても矛盾ではないように。そもそも、守備指標は抽象的な意味での「守備力」を数値化しているわけではなく、基本的に一定期間の打球処理の結果を数値化しているに過ぎません。

どちらかというと、打率に関しては数字が意味のある結果として尊重されすぎており(セイバーメトリクス的にはBABIPに近い数字で選手ごとの一貫性が弱く、細かく注目する実益に乏しい数字です)、守備指標に関してはその逆、という印象です。

私はここで、守備指標は文句なく作られているのに見る側の受け取り方が悪い、と言っているわけではありません。指標の中身の精緻化は、それはそれで追求すべきです。

問題は、打撃指標と守備指標では受け取られ方が違い、そうである限りは「仮に守備指標が完璧に作られていても」文句がつくだろうということです。冒頭に述べたように良し悪しの問題ではなく、指標の中身の問題とそれの受け取り方の問題は分けて論点を整理したほうが混乱が減るように思います。


続・盗塁阻止における捕手の肩の重要度

久々の更新。

前回の記事で、「盗塁阻止において捕手の肩の強さは思ったほど重要じゃない」という趣旨のMLBのリサーチを紹介しました。

それに関して、別の誰かの追試を見てみたいということを書いていたのですが、驚くことにNPBのデータで研究を行った結果が発表されていたのでここに紹介しておきたいと思います。こちらの記事自体2ヶ月ほど前のもので、既にご存じの方も多いかとは思いますが。


盗塁阻止を構成する要素に関する研究


詳しくはリンク先を見ていただくとしてここでは細かいことは説明しませんが結論としては

(1)捕手が使う時間よりも投手が使う時間のほうが盗塁阻止率との関連が強い。
(2)投手が使う時間ではリリースまでの速さが重要で、投球(放たれたボール)の速さはほとんど関係ない。

といったあたりについてはMLBと共通の様子でありつつ、捕手の絶対的な影響度の強さはMLBよりもかなり大きく出ているようです。
正直なところ、前回紹介したMLBの記事では捕手が消費した時間と盗塁阻止率との相関があまりにも低く(サンプルサイズの関係?)不自然だと感じていたので、感覚としてはNPBのリサーチのほうが納得しやすいと個人的には思っております。もちろん、どちらの出している数字が(絶対的に)正しいかという問題ではなく、数字は立体的に解釈する必要があるかと思います。

日米の比較に限らない話ですが、このように分析が広がっていくのを見るのは面白いですね。

盗塁阻止における捕手の肩の重要度

The Overrated Value of Catcher’s Throwing Arms (FanGraphs)

FanGraphsに出ていた分析記事。トピック自体わかりやすく、セイバーメトリクスによくある独特な計算(指標)が苦手という人でも問題なく入っていける面白いものだと思ったのでシェアしてみます。



テーマとして取り上げられているのは捕手の肩。一般的に盗塁阻止に関して大きな責任を負うのは捕手であるとされており、特に「盗塁阻止には捕手の肩の強さが決定的な要素である」という考え方が浸透しています。しかし著者はこの考えは本当だろうかと問いを立て、データを使って実態を探っています。

分析の内容としてはまず、対象を一塁から二塁への盗塁(二盗)に定めます。そして2011年と2012年にMLBで発生した7757の盗塁企図(二盗)から100個を無作為に抽出して標本を作り、その標本に含まれる盗塁について映像をフレーム単位で解析。「投手が投球動作をはじめてからボールが捕手のミットにおさまるまで(投手がかけた時間)」「捕手が捕球してから送球が二塁ベースに入った内野手のグラブにおさまるまで(捕手がかけた時間。元論文でいうpop time)」というふうにそれぞれの時間を記録します。

このようにして集めたデータを元に、それぞれの数字と盗塁阻止率がどう関係しているのかを分析していきます。まず捕手の捕球から送球の完了までの時間(pop time)と盗塁阻止率との相関係数は0.01であり、むしろほとんど関係がないという分析結果です。他方、投手が投球の動作に入ってから投球が捕手のミットにおさまるまでの時間と盗塁阻止率との相関係数は-0.88です。すなわち、投手が消費する時間が短いほど盗塁を阻止できる割合が上がるという強い負の相関関係があることがわかります。

さらに、投手が使っている時間はリリースまでの時間とリリースからの時間(すなわち球の速さ)に分けられます。著者はこのうちどちらがより重要なのかという点についても分析をしており、重要なのは投球動作をはじめてからリリースするまでの時間(元論文でいうmove time)だというはっきりした傾向が出ています。盗塁阻止率との相関は-0.90。球の速さと盗塁阻止率の相関は-0.04。

結論をまとめれば、はじめに立てた問いの「盗塁阻止には捕手の肩が決定的な要素であるという考えは正しいか」に対する答えは否であり、「盗塁阻止は投手がいかにリリースまでの時間を短くできるかでほとんど決まる」という結論となっています。

(著者は最後にreputation(評判)というものについても議論していますがごちゃごちゃしますし派生的なことなのでここでは割愛)





以下はブログ筆者がこの分析を読んだ感想。まず直球で面白い記事だと思いました。盗塁阻止率で捕手の守備を評価するというセイバーメトリクスでもやりがちな評価に一石を投じるものであると思います。もっとも、盗塁阻止には投手の影響のほうが大きいといったことの言及自体はJohn Dewan『The Fielding Bible Volume II』(ACTA Publications、2009)にもありますし実際の評価手法にも既に反映されていますから、発見自体が斬新であるというわけではありません。それでも一般的に興味を持った範囲でできる検証でわかりやすい形にまとめているという点でいい研究記事だと感じます。

セイバーメトリクス云々を別にしても、現に野球界は盗塁を考えるときに捕手の肩というのを重視しているはずで、その行動(思考)様式が果たして有効かという点を冷静に考えさせる結果だと思います。新人の捕手を紹介するときによく遠投何メートルとか、二塁送球が1.8秒だとか言いますよね。しかし盗塁阻止は当然に投手と捕手の共同作業であって、捕手の肩が強かったところで実状としてどれだけ勝利への効果があるかという問題があります。この研究とは別に盗塁というものが得点価値で見れば思ったほど重要でないというセイバーメトリクスの知見もあり、例えば捕手のドラフト指名を考えるときに肩の強さを重要な事項として見ることは総合的な勝ち負けの観点から果たして有効なのだろうかと疑問になります。

この研究のような「(物理的な部分を)実際に測ってみればいいじゃん」というのは観測に曖昧さが生まれるのもあってセイバーメトリクスの世界ではあまり行われません。しかし、もちろん測ってみて何か重要なことがわかるのであれば大事です。さらに、最近はいわゆるトラッキング系のデータが流行りで、高性能カメラ&専用ソフトウェアで物理的に選手やボールの動きを計測して評価してしまいましょうというのはトレンドです。捕手の守備に関してもトラッキングデータによるフレーミングの評価が行われるようになっていて、盗塁阻止に関しても同様にトラッキングデータを使って送球のタイムで評価するとか、盗塁阻止の結果を投手のクイックの速さで補正するとかいう道は十分に考えられます(当然、逆に、投手は盗塁阻止について多くの責任を負うのですから、WARの計算でその点を加味する必要があるでしょう)。その意味でも、このように具体的に切り込んでプレーのダイナミズムを明らかにしていくのは可能性を感じさせる研究です。

最後に、一応この分析には次のような留意点も挙げられるかと思います。

(1)手集計なので仕方がない部分ですが、一般的な結論として自信を持つにはサンプルサイズが少ないように思います。またどの時点をもって「投手が投球の動作を開始した」「捕手がボールを捕球した」と言えるかについては観測者によって偏り・ばらつきも出るかと思いますので、その点は注意が必要でしょう。別の誰かが独立に追試をした結果が得られれば理想的です。

(2)著者も述べている留意点として、投球が届いた位置や捕手の送球の位置などがどう絡んでくるかが明らかにされていません。また右投手・左投手の違いやイニングなどシチュエーションの問題までは今のところ踏み込まれておらず、とにかく「二盗」をひとまとまりとして捉えています。今後このような点に踏み込んで見てみるともう少しケースバイケースの結論が出るかもしれず、「捕手の肩はそんなに重要じゃない」と大雑把に言ってしまうのは馴染まなくなる可能性もあります。

WikipediaのDRS項目

簡単に更新。

かなり前から思っていた(書きそびれていた)のですが、WikipediaのDRS項目にある「デメリット」の

「同じプレーをしても状況によって変動が異なる。たとえば、無死満塁と二死無走者で同じプレーをしても、得点期待値の変動が異なる以上、守備防御点の変動も異なる」

という記述、間違っていますよね? 示されている算出方法の式もおかしいような……。

得点期待値の変動を見るというのは、あくまでも守備プレーと得失点をどう対応付けるのかの原理を説明したものであって、その計算がそのままDRSになるわけではないはずです。プレー数(アウト獲得数)のプラス/マイナスを出してから一般的な得点価値を掛け合わせるため、指摘されているような状況による偏りは生じないはず。

John Dewan『The Fielding Bible Volume II』(ACTA Sports, 2009)では、得点期待値の変動で価値を測定する原理を説明した後の部分に次のように書いてあります。

「全てのプレーについてこの手続きを行ってみると、その得点価値には守備力と無関係な多くのノイズが含まれていることがわかる。例えば、二死満塁で難しい打球をアウトにするのは2点もの価値になり得るが、二死無走者での同じプレーは10分の1の価値で、これは何ら守備者の落ち度ではない。これは守備者がほとんどコントロールすることのできない、状況による偏りである(私たちがまたの機会のためにとっておく議論「クラッチ・フィールディング」について議論したいのでもなければ)。この偏りを補正するため、プラス/マイナスの1ポイントが何点の価値があるのかを見る。チェイス・アトリーの+46プレーは何点の価値があるだろうか? 二塁については、平均的なプラス/マイナスのポイントは.76点になる。すなわち2008年のチェイス・アトリーのプラス/マイナス失点阻止値は35だ。(p.14、拙訳)」

最近はFanGraphsなどで数字が見られますがこの辺は重要なポイントなのでご注意ください。
多分計算法変わったりはしていなくてこの認識で合っていると思うのですが、もし間違いがありましたらご指摘いただけますと幸いです。

 | HOME |  »

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。