Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

守備指標がさらされる目線

守備指標がさらされる目線についてふと考えて、ツイッターに書こうと思ったのですが長くなったのでこちらで。


守備指標の妥当性がいつも厳しい目にさらされるのは、指標自体の性質云々より、一般に守備について数字を結果として受け入れる慣習がないという要因が大きいと思います(そのことの良し悪しは別として)。

打率は.298と.300の差であっても、それが統計学的に見て注目に値するものでなかろうが、「彼が三割打者になるために足りなかったのは何か」などと、数字を結果として厳粛に受け止めたうえで中身は中身で考えるという慣習があります。

「阿部はすごく技術がある名打者なのに.250になるなんて、打率とかいう指標はおかしい」とは言いません。結果は結果です。

これに対して守備については何故か、プレーの内容としての上手い・下手の評価ありきで、指標の数字がそれに合わないと指標の中身が怪しまれます。打撃とパラレルに考えれば、(潜在的な)能力として上手いとされる選手であっても、ある期間の打球の処理の結果がたまたま芳しくないということがあっても「指標がおかしい」となる必然性はないはずです(スイングのいい打者の打率が低くても「打率が指標としておかしい」わけではないのと同じ)。もちろん、主観的な評価の方が適切である保証もありません。

言い方を換えれば、主観的には守備が上手いと思うのに指標の結果が悪い、というのは、矛盾する結果ではないので主観と指標のどちらかを否定する必要もなく、その関係を理解すればいいという話です。くどいようですが強打者でも打率が低いシーズンがあっても矛盾ではないように。そもそも、守備指標は抽象的な意味での「守備力」を数値化しているわけではなく、基本的に一定期間の打球処理の結果を数値化しているに過ぎません。

どちらかというと、打率に関しては数字が意味のある結果として尊重されすぎており(セイバーメトリクス的にはBABIPに近い数字で選手ごとの一貫性が弱く、細かく注目する実益に乏しい数字です)、守備指標に関してはその逆、という印象です。

私はここで、守備指標は文句なく作られているのに見る側の受け取り方が悪い、と言っているわけではありません。指標の中身の精緻化は、それはそれで追求すべきです。

問題は、打撃指標と守備指標では受け取られ方が違い、そうである限りは「仮に守備指標が完璧に作られていても」文句がつくだろうということです。冒頭に述べたように良し悪しの問題ではなく、指標の中身の問題とそれの受け取り方の問題は分けて論点を整理したほうが混乱が減るように思います。


スポンサーサイト

K-BBの参考記事

『セイバーメトリクス・リポート3』(今年の4月発売)に寄稿した「投手の成績を予測する簡単な方法」という記事で、(K-BB)/PAという式で計算できる指標(K-BB)の有効性について書きました。

これに関してはアメリカで先行研究があります。なのですが、紙面の流れ上、直接関連する記事を一部引用した程度であとは「一連の研究があります」という程度の記述に留まり具体的な記事の名前(URL)を挙げられませんでした。
このためちょっとしたオマケというか補足の意味で、私が参照した一連の記事を載せておきたいと思います。



日付著者タイトル
2012/9/19Glenn DuPaulShould we be using ERA estimators during the season?
2012/9/19TangotigerForget all that other bullsh!t: just use K and BB to forecast rest-of-season ERA
2012/9/26Glenn DuPaulOccam’s Razor and pitching statistics
2012/9/26TangotigerOccam’s Razoring pitching stats
2012/10/3Glenn DuPaulPredictive FIP
2012/10/3TangotigerPredictive FIP
2012/10/10Glenn DuPaulDelving deeper into predictive FIP
2012/10/18Glenn DuPaulShould we even try to predict future runs allowed for relievers?
2012/10/24Glenn DuPaulShould we ever use a complex ERA estimator?
2012/11/2Glenn DuPaulShould we be trying to predict FIP instead of ERA?
2012/12/12Glenn DuPaulReinforcing the power of predictive FIP
2012/12/21Glenn DuPaulLeaders in kwERA
2012/12/21TangotigerkwERA
2012/12/24TangotigerkwERA Awareness
2013/2/6Glenn DuPaulStandard deviation and ERA estimators
2013/2/20Glenn DuPaulMore on standard deviation and ERA estimators
2013/2/20TangotigerShould we prefer a spread in forecasts?


流れとしてはGlenn DuPaulがK-BBの有用性に注目してさまざまな試みをし、これ自体は実は新しい発見ではないのだけれども、あまり系統的に整理されてはいなかったので車輪の再発明を避けるという意味でも有意義なまとめをしてくれてるよねという観点でTangotigerが逐一コメント(で、そのコメントに対してまたGlenn DuPaulが発展的な分析を提示)しているような形です。

私がリポート3で触れたよりも発展的な内容(例えば予測のためのFIPとして、K-BBに本塁打の要素を加えたらどうなるのか)にも触れられていたりするので、それほど複雑な話ではないですしひとつひとつの記事は重くないので読むと面白いと思います(最後のpFIPの式はなかなか美しい)。


続・盗塁阻止における捕手の肩の重要度

久々の更新。

前回の記事で、「盗塁阻止において捕手の肩の強さは思ったほど重要じゃない」という趣旨のMLBのリサーチを紹介しました。

それに関して、別の誰かの追試を見てみたいということを書いていたのですが、驚くことにNPBのデータで研究を行った結果が発表されていたのでここに紹介しておきたいと思います。こちらの記事自体2ヶ月ほど前のもので、既にご存じの方も多いかとは思いますが。


盗塁阻止を構成する要素に関する研究


詳しくはリンク先を見ていただくとしてここでは細かいことは説明しませんが結論としては

(1)捕手が使う時間よりも投手が使う時間のほうが盗塁阻止率との関連が強い。
(2)投手が使う時間ではリリースまでの速さが重要で、投球(放たれたボール)の速さはほとんど関係ない。

といったあたりについてはMLBと共通の様子でありつつ、捕手の絶対的な影響度の強さはMLBよりもかなり大きく出ているようです。
正直なところ、前回紹介したMLBの記事では捕手が消費した時間と盗塁阻止率との相関があまりにも低く(サンプルサイズの関係?)不自然だと感じていたので、感覚としてはNPBのリサーチのほうが納得しやすいと個人的には思っております。もちろん、どちらの出している数字が(絶対的に)正しいかという問題ではなく、数字は立体的に解釈する必要があるかと思います。

日米の比較に限らない話ですが、このように分析が広がっていくのを見るのは面白いですね。

盗塁阻止における捕手の肩の重要度

The Overrated Value of Catcher’s Throwing Arms (FanGraphs)

FanGraphsに出ていた分析記事。トピック自体わかりやすく、セイバーメトリクスによくある独特な計算(指標)が苦手という人でも問題なく入っていける面白いものだと思ったのでシェアしてみます。



テーマとして取り上げられているのは捕手の肩。一般的に盗塁阻止に関して大きな責任を負うのは捕手であるとされており、特に「盗塁阻止には捕手の肩の強さが決定的な要素である」という考え方が浸透しています。しかし著者はこの考えは本当だろうかと問いを立て、データを使って実態を探っています。

分析の内容としてはまず、対象を一塁から二塁への盗塁(二盗)に定めます。そして2011年と2012年にMLBで発生した7757の盗塁企図(二盗)から100個を無作為に抽出して標本を作り、その標本に含まれる盗塁について映像をフレーム単位で解析。「投手が投球動作をはじめてからボールが捕手のミットにおさまるまで(投手がかけた時間)」「捕手が捕球してから送球が二塁ベースに入った内野手のグラブにおさまるまで(捕手がかけた時間。元論文でいうpop time)」というふうにそれぞれの時間を記録します。

このようにして集めたデータを元に、それぞれの数字と盗塁阻止率がどう関係しているのかを分析していきます。まず捕手の捕球から送球の完了までの時間(pop time)と盗塁阻止率との相関係数は0.01であり、むしろほとんど関係がないという分析結果です。他方、投手が投球の動作に入ってから投球が捕手のミットにおさまるまでの時間と盗塁阻止率との相関係数は-0.88です。すなわち、投手が消費する時間が短いほど盗塁を阻止できる割合が上がるという強い負の相関関係があることがわかります。

さらに、投手が使っている時間はリリースまでの時間とリリースからの時間(すなわち球の速さ)に分けられます。著者はこのうちどちらがより重要なのかという点についても分析をしており、重要なのは投球動作をはじめてからリリースするまでの時間(元論文でいうmove time)だというはっきりした傾向が出ています。盗塁阻止率との相関は-0.90。球の速さと盗塁阻止率の相関は-0.04。

結論をまとめれば、はじめに立てた問いの「盗塁阻止には捕手の肩が決定的な要素であるという考えは正しいか」に対する答えは否であり、「盗塁阻止は投手がいかにリリースまでの時間を短くできるかでほとんど決まる」という結論となっています。

(著者は最後にreputation(評判)というものについても議論していますがごちゃごちゃしますし派生的なことなのでここでは割愛)





以下はブログ筆者がこの分析を読んだ感想。まず直球で面白い記事だと思いました。盗塁阻止率で捕手の守備を評価するというセイバーメトリクスでもやりがちな評価に一石を投じるものであると思います。もっとも、盗塁阻止には投手の影響のほうが大きいといったことの言及自体はJohn Dewan『The Fielding Bible Volume II』(ACTA Publications、2009)にもありますし実際の評価手法にも既に反映されていますから、発見自体が斬新であるというわけではありません。それでも一般的に興味を持った範囲でできる検証でわかりやすい形にまとめているという点でいい研究記事だと感じます。

セイバーメトリクス云々を別にしても、現に野球界は盗塁を考えるときに捕手の肩というのを重視しているはずで、その行動(思考)様式が果たして有効かという点を冷静に考えさせる結果だと思います。新人の捕手を紹介するときによく遠投何メートルとか、二塁送球が1.8秒だとか言いますよね。しかし盗塁阻止は当然に投手と捕手の共同作業であって、捕手の肩が強かったところで実状としてどれだけ勝利への効果があるかという問題があります。この研究とは別に盗塁というものが得点価値で見れば思ったほど重要でないというセイバーメトリクスの知見もあり、例えば捕手のドラフト指名を考えるときに肩の強さを重要な事項として見ることは総合的な勝ち負けの観点から果たして有効なのだろうかと疑問になります。

この研究のような「(物理的な部分を)実際に測ってみればいいじゃん」というのは観測に曖昧さが生まれるのもあってセイバーメトリクスの世界ではあまり行われません。しかし、もちろん測ってみて何か重要なことがわかるのであれば大事です。さらに、最近はいわゆるトラッキング系のデータが流行りで、高性能カメラ&専用ソフトウェアで物理的に選手やボールの動きを計測して評価してしまいましょうというのはトレンドです。捕手の守備に関してもトラッキングデータによるフレーミングの評価が行われるようになっていて、盗塁阻止に関しても同様にトラッキングデータを使って送球のタイムで評価するとか、盗塁阻止の結果を投手のクイックの速さで補正するとかいう道は十分に考えられます(当然、逆に、投手は盗塁阻止について多くの責任を負うのですから、WARの計算でその点を加味する必要があるでしょう)。その意味でも、このように具体的に切り込んでプレーのダイナミズムを明らかにしていくのは可能性を感じさせる研究です。

最後に、一応この分析には次のような留意点も挙げられるかと思います。

(1)手集計なので仕方がない部分ですが、一般的な結論として自信を持つにはサンプルサイズが少ないように思います。またどの時点をもって「投手が投球の動作を開始した」「捕手がボールを捕球した」と言えるかについては観測者によって偏り・ばらつきも出るかと思いますので、その点は注意が必要でしょう。別の誰かが独立に追試をした結果が得られれば理想的です。

(2)著者も述べている留意点として、投球が届いた位置や捕手の送球の位置などがどう絡んでくるかが明らかにされていません。また右投手・左投手の違いやイニングなどシチュエーションの問題までは今のところ踏み込まれておらず、とにかく「二盗」をひとまとまりとして捉えています。今後このような点に踏み込んで見てみるともう少しケースバイケースの結論が出るかもしれず、「捕手の肩はそんなに重要じゃない」と大雑把に言ってしまうのは馴染まなくなる可能性もあります。

セイバーメトリクスに入門していくためのサイトまとめ(英語)

ボストン大学がセイバーメトリクスの講座をオンラインで無料で提供するということがちょっとした話題になっています。
それを見て、なるほど英語でもセイバーメトリクスに入門していくのに役立つような情報をまとめておくと意味があるかもしれない、と思いました。
そんなことで、私の狭い見聞の範囲ですがセイバーメトリクスを知るのに有益なサイト(フリー)を並べてみました。





まずはSABRに掲載されている「セイバーメトリクス研究のガイド」。
セイバーメトリクスとは何かから重要文献、研究の仕方、使えるウェブサイト、データの探し方、成果の発表場所などあらゆることをまとめてくれており、「こういう良まとめがあるから見てね」でこのブログ記事自体終わりでいいんじゃないかというレベルです。

A Guide to Sabermetric Research



『メジャーリーグの数理科学』でお馴染みの統計学者ジム・アルバートによるセイバーメトリクス入門。
最近書かれたものではないため現在から見るとやや古めかしく見える内容ではありますが、アカデミックな人物による記述ということでおさえておくのもいいかと思います。
理学系でガッツリいきたい方はGoogle ScholarでJim Albertと検索して論文を探してみるのも良いかもしれません。

An Introduction to Sabermetrics



セイバーメトリクス系シンクタンクのBaseball Prospectusによる入門系のコラムシリーズ。
具体的なデータも交えながら一般的なセイバーメトリクスの分析を見る上で重要な前提になるところを説明してくれています。

Baseball Prospectus Basics



同様にセイバーメトリクス系の情報を発信するFanGraphsのサイトの用語解説集。
指標だけでなく一般的な原理についても解説があり、簡潔でありながらポイントをおさえた説明がいいバランスでちょっと用語を参照するには最適ですしただ読んでいくだけでも勉強になります。

FanGraphs Library



こちらもセイバーメトリクス系のサイトとしてはお馴染みのThe Hardball Times。
以下にリンクしているのはリファレンス用の記事まとめで、過去THTに掲載された良質な分析記事がトピックごとにまとめられています。
これらは入門というより実践編の分析ですが、入門を踏まえて実際に分析したものに触れるにはいいまとめです。

The Hardball Times Reference



セイバーメトリシャンの大御所(?)Tangotigerのサイト。
まとめられている分析もさることながら、ブログが超重要。コメント欄には著名な分析家たちが集います。

Tango on Baseball



こちらもセイバーメトリシャン、Patriotのサイト。
評価基準やパークファクター、得点推定式など基礎的で重要な事柄がまとめられています。ブログの方の内容も濃いです。

Buckeyes and Sabermetrics

Walk Like a Sabermetrician



応用編かもしれませんが、セイバーの論文集"By the Numbers"がPDFで読めます。こちらに関しても分析家Phil Birnbaumのブログも絶品です。

philbirnbaum.com








とりあえずざっと思いつくところを並べましたが、また気が付いたら追記します。






余談になりますが、近年はデータ分析への注目の高まりもあり、いわゆる伝統的なセイバーメトリクスのような亜流のゴリゴリ計算とアカデミックでまともな(?)統計学・データサイエンスが出会ったり対立したりという場面があるようです。

アカデミックな世界にいる研究者はしばしばネットの世界で広まっている分析を無視しますし、「査読論文でもない強引な計算のものを分析とか言われてもね」というところもあるようです。
一方それに対してネットで激論を交わしながら分析を進めているセイバーメトリシャンたちからは「手法の厳密さや論文の体裁にばっかりこだわってダサイ分析してるやつが何言ってんだ? アカデミアの連中が重要で有効な知見を発見したことが一度でもあったか? むしろオンラインでは分析が数々の知性のある人間の『査読』に晒されているんだよ」みたいな意見があったり(もっともこれら主張は前にどっかで話題になっていたものを思い出しつつ大袈裟に書きだしてみたものなので冗談半分にお受け取り下さい……。ただ、憤っている「ストリート」のセイバーメトリシャンの側も博士号持ちだったり、ただお互いの事情を知らずに感情的にやりあっているわけではありません)。

上記で紹介したのはほとんど「ストリート」系の技法的には単純で実益重視の分析ですが、近年MLBでは得られるデータの種類も量も凄まじいものになっており、思いつきで数字と数字を割り算するような分析よりも「素材を活かした」まともなデータ分析が求められるというか、少し潮流は変わりつつあるように思います。冒頭のオンライン講義もセイバーメトリクスの紹介だけでなくコンピュータを使ったデータサイエンスの授業でもあるということで、そのあたりも注目度の高さに関係があるのかもしれません。


 | HOME |  »

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。