Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

SMM2をもっと楽しむために

先日発売しました『セイバーメトリクス・マガジン2』についてもう少し書きます。

特集の守備企画なんですが、やはり少し難しいのでというお話が編集の秋山さんからあり、ちょっとした解説として岡田さんと私の対談みたいなものが収録されています。

が、まとまりなく好き勝手なことを喋ってしまい(編集に負担をかけたうえ)あまり読み進める上でのガイドになるような内容を残せなかったなぁと反省しております。

そこでこのブログの場を使って、守備企画を読んでいくうえでのガイドあるいは補足あるいは勝手な感想みたいなものを少し書いてみようかと思い立ちました。

多分また大した内容にならないと思いますが、ネタバレをしない程度に自分として感じたポイントなどをつらつらと書きつつリンクなどを貼って周辺の話題を紹介していこうかなと。著者の方が伝えたい大事な内容はもちろん本に書かれているわけですが、こういうところもおさえておくとさらに今回の企画を楽しめるかも、ということで。

※長くなってしまったので適当に拾い読みして下さい。




【UZRに親しむ】

今回の守備企画の基礎には、なんといってもUZRがあります。UZRがわからないと、話全体がわからないことになってしまいます。

セイバーメトリクスの指標って大概は別に数学的に高度なものでもないし、発想のポイントさえ掴めればすぐに理解できるのですが、このUZRに関しては「ちょっと難しい」と思っておいたほうがいいかもしれません。

もちろん高度な専門知識がなければ理解できないとかそんなレベルの話ではないので恐れる必要は全くないのですが、「なんとなく」わかったつもりで流すのではなくて、時間としては30分もいらないのでどこかで一回腰を据えて説明を読みロジックを追うことお勧めしたいのです。

UZRは守備の得失点をうまく表現するために工夫して作られていることが見て取れる内容になっていて、「なんとなく」の理解だとその工夫を見逃してしまいがちかと思います。なので一度きちんと取り組む心構えを持ったほうがいいと思うわけです。例えば緩いゴロが三遊間を抜けたとき、三塁手と遊撃手はそれぞれどう評価されるのか。それが強いゴロだったらどうなるのか。遊撃手が捕球してアウトにしたら三塁手はどう評価されるのか。ただ単に「獲得アウト/ボールインプレー」で評価する場合とどう違うのか。こういったことを説明できることが重要です。

日本語の資料は少ないですがウィキペディアのUZR項目で計算の骨格は掴めると思います。開発者MGLの説明文を三宅さんが翻訳してくれているものもありますのでそちらもお勧めです。

ウィキペディア:UZR

MGLのコラム(三宅さんによる翻訳)


英語の資料ではFanGraphsに掲載されているMGL自身による記事が、仕組みや活用にあたってのポイントなどを網羅していて非常に有益です。

UZR Primer




【守備企画全般について】

UZRはここが本邦初登場というわけではないので今更な部分もありますが

(1)選手の守備力を定量的な基準で比較することができる
(2)守備の得点(失点)の意味での具体的なインパクトがわかり、攻撃や投手のそれと比較することができる
(3)守備全体に点数を割り当てるだけでなく、その中身までわかる

といった点について、改めてすごいなぁと今回のSMM2を読んでいて思いました。なにしろ、(特に日本では)ちょっと前までは「優れた守備者はシーズンで失点をどのくらい防いでいるのか? 100点? 10点? 50点?」みたいな状況だったわけですから。

個人的に5年くらい前は、日本でゾーンレーティングの計測が行われるのなんて20年は先の話だろうと思っていました。現に出ているものを見た後からすると当たり前のようでも、やはりけっこう驚くべきことです。ただ守備の良い悪いを言うだけじゃなくて、これを材料に野球の様々な部分を考えていくことができるはずです。

話が逸れてますね。以下では、分析者の方ごとに分けて、自分が気になったポイント(というか素朴な感想?)をごく簡単に書いてみたいと思います。読む上でのガイドといえば偉そうですが(ネタバレしない範囲で)例えばこういうところが面白いですよね、という話として。



【Student氏参考分析(三塁手)】

いつも仕事の丁寧なStudentさんらしいところですが、データの中身をわかりやすく図と表に出してくれているので、守備について詳細なところがわかるようになっています。ゾーンデータの恩恵がわかりやすく感じられます。

例えばStudentさんの分析を一旦別として、素朴にデータを眺めて何が言えるかを自分なりに考えてみるのも楽しいです。



【morithy氏参考分析(遊撃手・左翼手)】

遊撃手について言えば、ゴロ打球だけでなくエア打球(フライ・ライナー)を分析に含めている点が特徴的です。通常内野手のUZRはゴロだけが対象なので。この点、開発者のMGLはエア打球を含めるのは絶対にダメだと言っているのではなく、含めるほうがいいかもしれないという議論もあります。色々考えてみるのも一興です。

またゴロの分析では三遊間・正面・二遊間という3分割を採用しており、これはフィールディング・バイブルなんかでも見られますがイメージしやすくていいな、と思いました。単純なことですが分析の結果を説明するうえで「この選手は方向EとFの打球に強い」とか言うより「三遊間に強い」と言うほうが圧倒的にわかりやすいですからね。

余談ですがmorithyさんはUZRのデータが得られる以前から守備の分析について野心的な試みを多く行われてきた方です。morithyさんの個人サイトに行くとレンジファクターを改良した系統の評価を往年の選手について見ることができ、小坂の守備がどれだけ凄かったかなんてことがわかったりして非常に楽しいです。未読の方はこの機会にぜひ。

日本プロ野球計量分析レポート&データ集



【岡田氏参考分析(中堅手・右翼手)】

守備範囲が一目でわかるように可視化している点やアームレーティングの内訳が見られる点が「オイシイ」ところですね。

例えば中堅手のアームレーティングの内容を見ていくと、発生する頻度や直接ホームインになるプレーである関係からであると思われますが、二塁走者を単打で生還させるかどうかの部分で選手ごとの差が大きいことがわかります。単に選手ごとの点数が出るというだけでなく、勝敗に影響が大きいプレーは何かというのが定量的にわかるのは野球の知見として重要かと思います。

走者が外野手の肩を警戒して進塁を留まるのは外野手の「貫禄」のような漠然としたものとして扱われてきた感がありますが、冷静に考えれば塁の状況としてリアルに観察できる事実です。そういうことをきちんと観測したら、どのくらい勝敗に影響があるのか? 誰が優れているのか? この辺がわかるようになった意義は大きいなぁと改めて感じました。



【道作氏参考分析(捕手)】

UZRによる原則評価では済まない捕手ですが、結論としては現状出来る範囲で無理のない評価をなさっているという印象です。式は書かれていませんが評価法を文字通りに読めば例えば当方がサイトに出している手法にかなり近いのではないかと思います。

これはかなり個人的な感想なのですが、自分の中に「みんな色々言ってきたけど、結局捕手の評価をどうにかできたんだっけ?」という疑問がありまして、「本音を言うのならば、何か長年の懸案事項が片付いていないことを再確認させられるようなポジションなのだ」という道作さんのコメントには物凄く深く頷いてしまいました。フィールディング・バイブルなんかはかなり頑張って具体的な形も示しているので、そういう頑張りをないがしろにするわけではないのですが。

なお道作さんは個人サイトで以前から捕手の守備評価に関して色々なアイデアを持って挑戦されており、その他コラムでもリードなどについて思索を示しておられるので、合わせて読むと面白いこと間違いなしかと思います。

捕手守備指標(試案)

クレタ人はウソつきだ、とクレタ人は言った。



【三宅氏参考分析(一塁手)】

目次にも出ているので)結論から言うと一塁では浅村が最優秀なのですが、これを「反則技」と称しているのが面白いところです。

普通一塁というのは一塁しか守れないような選手が守るわけですが、他の守備位置を普通に守れるくらい「動ける」選手が入ってくると異常に高い数値が出てしまうと。

守備指標を見ていると、こういうのは外野のレフトとかでよくある話です。レフトはレギュラーに「打てるけど守れない」タイプの選手が多く、そんな中で控えの選手が守備固めでそれなりの出場をしたとき、びっくりするくらいのプラスが計上される場合があります。

外野なら守備範囲の差はダイレクトに被安打に反映されやすそうだし一安打の価値も重いしわかりやすいのですが、これが一塁でも起こったというのが面白いです。一塁手といえば守備の影響が少なそうなので守備の優劣はそれほど語られず打撃力でレギュラーが選ばれる印象がありますが、例えばの話、めちゃくちゃ俊足で動ける選手を一塁手専門として鍛えたら、打撃がたいしたことなくても総合的な利得で他の一塁手を凌駕するようなことがあるんだろうか?(それを狙うのは戦略としてアリなのか?) なんて考えてしまいました。



【蛭川参考分析(二塁手)】

自分のは言及しても仕方がないと思ったのですが、Batted Ballsの評価を組み入れたことについて少し背景を付け加えておこうかと思います。

理論的にはUZRというのは非常によくできた守備指標だと思いますが、現実に計算をするためには打球の性質を細かく記録する必要があります。問題は、その記録って本当に信頼できるの?ということです。出塁したかしてないかみたいに客観的にはっきりした区別で記録できるものではなくて、打球はどこに飛んだか、種類は何か、強さはどうかというアナログな記録ですから、客観的に記録ができるかという疑問が生じたとしても無理もないところです。これは作業担当者の能力やモラルを疑うとかいう話ではなくて、そもそもそういう種類の記録を行うことの仕組みとしてどの程度の正確性・客観性が確保できるのだろうかと。

Colin Wyersが有名な論者ですが、MLBの方面でこの辺は健全な懐疑として言う人は言います。統計にとってバイアス(系統誤差)というのは厄介なもので、もしデータの採り方によって結果にバイアスが含まれるなら、(ランダムな誤差と違って)サンプルサイズを増やしてもこれは解消しません。だったらバイアスがないようなシンプルなデータの採り方(例えば単純にゴロに対する獲得アウトの比率)でやってみて、打球の分布によるランダムな誤差はただサンプルを増やすことで排除すればいいんじゃないの、という考え方もあるわけです。もちろんその場合は5年や10年など長いタームでしか守備指標を出せないですが。

個人的には、アナログだから誤差があり得るといっても三塁手の正面に飛んだ打球が一・二塁間への打球に見えるなんていうことはあり得ないのであって、打球の種類などに関しても、多少の誤差はあっても基本的に実際の分類が「真の分類」の近くに分布していれば結果にそう違いは出ないはずだし、打球がどこに飛んでも分母に数えられるような指標に比べれば守備の働きを表すものとして(完璧ということはないのは前提で)圧倒的に有益だと考えています。

アメリカではField f/xみたいな夢のある話も持ち上がっていますがいずれにせよ一般にオープンなものではありませんし、理想的なシステムが使えない以上はできる手段でなんとか頑張るしかありません。もっと言えば、Field f/xみたいなシステムがあったとしても、目的に対して誤差がゼロということはあり得ませんし正しく機能していることを一般ユーザーがどう確認するのかという話で、この辺の懐疑は言い出せばキリがないというところもあります。そういう中でゾーンのデータを収集する、アメリカで言えばBISなどの努力をただ否定するのも非建設的です。長期で見ればゾーンの情報を使わない守備指標と照らし合わせて結果がデタラメでないか検証していくこともでき、MGLはそのような検証でUZRの有効性を確認しています(フィールディング・バイブル3にて)。

ただ、上記の議論は上記の議論として、あくまで記録の正しさを外部からは確認ができないというのもありますし、系統的な偏りの可能性もあるにはあるので、少なくともゾーンの情報を使わない評価を参考として並べてみる意義はあると思いますし、最終評価を出す際には多少考慮するのもアリ、という考えです。

向き合い方の一例としてTangotigerは、翌年の守備成績を予測しようと思えば「UZR×40%+FRAA×10%+平均値×50%」というような形になるだろうとしていて、このときFRAA(ゾーンの情報を使わない守備指標)はUZRに含まれる観測データのバイアスを除去する働きをする、としています。個人的にもおそらくこのくらいの使い方が妥当なところだろうと感じます。

「なんでこの人はUZRがあるのにアウト/ゴロなんて気にするんだろう?」と思われたかもしれませんが、背景にはまぁそんなような議論が色々とあるわけです。

UZRやDRSのようなゾーンベースの守備指標があり、他方でそれらに対する一種のアンチテーゼとしてBaseball ProspectusのFRAAやTangotigerのWOWYみたいなゾーンを使わない評価手法があるというのは見ていくと面白い点です。



以上ぐだぐだと、原理や方法論の話ばかりで失礼しました。



コメント

一つもしエクセルでざっと計算できるなら教えて欲しいのですが、ずばり MLBのパークファクターの数値と勝率に深い相関関係が見られるのでしょうか?

できれば ここ3年のポストステロイドエラと10年前のステロイドエラ3年でどうなっているのか 調べてもらうことはできませんか?

堂々と生島某が記事をヤフーのTOPでそんなことを述べていたのですが、私はそこまで相関関係があるようには思えません

>沖さん
その記事を存じませんしMLBの分析は普段全然しないので、すみませんが分析は遠慮しておきます。
しかしパークファクター(得点?)が勝率そのものに対して相関するというのは、筋としては妙な話ですね。

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/555-0212a3bd

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。