Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

【告知】『セイバーメトリクス・リポート3』

発売は月末でもう少し先ですが、セイバーメトリクスのアニュアル本である『セイバーメトリクス・リポート』が、今年も出ます。第三弾。

セイバーメトリクス・リポート3 (Amazon.co.jp)

今回も色々データが載っていたり、分析家によるコラムがあったりという内容です。昨年の秋に発売された『セイバーメトリクス・マガジン2』で既に2013年のWARが発表されていますが、そのアップデートバージョンも収録されています(本ブログで行ったような議論を反映)。

私は個人ネタとしては今回、「投手の成績を予測する簡単な方法」という記事を書きました。内容的には「カジュアルな数字遊び」と「分析的にちゃんと意味のあるデータ活用」のちょうど合間のような、簡単だけど使える指標の紹介をしています。

例えばWHIPは、計算が簡単かつ直観的で誰でもすぐに理解できる指標です。しかし残念ながら、何かを分析する際にWHIPが役に立つことは全然ないという点が散々指摘されており、わかりやすくて計算しやすかったところで意味ないよね、という話になってしまいます。

他方、成績予測などは(細かい精度の問題はともかく)情報としては誰もが求めるような性格のものですが、当方が行っているような比較的簡単な算出でさえ、おそらくやろうとする人は非常に少ないでしょう。端的に言って、面倒臭いです。

簡単に計算できるWHIPは役に立たない。役に立つ情報を求めると煩雑になる。しかし、WHIPのような簡単さで、成績予測みたいな性格の有用な情報が得られる指標があるとしたら……? と、そんな話がテーマになります。ゴリゴリの難しい感じではなく、軽く読んでいただけると思います。



ところで、当方が関わっているガチセイバーメトリクス系出版物も『セイバーメトリクス・リポート』が本作で3つめ、『セイバーメトリクス・マガジン』が既に2つと、数が多くなってきました。これまではスルーしてきたけど今からどれか買ってみようかとお考えの方も、中にはいらっしゃるかと思います。

基本的に、アメリカで出ているTHTとかのアニュアルもそうなのですが、別に1から順番に読まないといけないというものではありませんので今年の3ではじめて読むというのでも大丈夫です。

もちろんある程度、過去の研究を踏まえた発展などの流れはありますので、1から全て読んでいるほうが話がよくわかるということ自体は間違いありません。また、セイバーメトリクス系の日本語書籍の中ではおそらくもっともコアなシリーズなので、セイバーメトリクスについて全く何も知らない、というところから入ると戸惑う部分はあろうかと思います。

このあたり、もし予備知識を強化したいということでしたら例えば拙サイト道作さんのサイト、あるいは無料公開されたセイバーメトリクスの歴史をさらったコラムなんかを見ていただければ、特段別の書籍などを購入せずとも内容に馴染むための基本的なところは把握していただけるかと思います。

また、今回の『リポート3』には「リポートの理解を助けるセイバーメトリクスの基礎解説テキスト」があったり、例年通り用語解説があったりしますので、興味さえあればそれほど構える必要はないかと思います。


投手WARのフレームワーク


What is WAR for pitchers? (Tangotiger Blog)

TangotigerがWAR(投手)のフレームワークを一行の式で書き表しています。
こういうのは頭が整理されて面白いので、真似をしつつちょっと変えて、自分も投手WARの計算を式にしてみました。


WAR=(投球回/9)×(リプレイスメント失点率-失点率)/RPW×レバレッジ

※リプレイスメント失点率は、NPBでは平均失点率の1.3~1.4倍程度。
※RPWは通常10前後。
※レバレッジは先発投手は1.0、救援投手は役割により0.7~1.5程度。


WARはこんな感じの「フレームワーク」で、それ自体は普遍的です。そこから失点率をどういうふうに「守備から独立した」ものにするか(あるいはしないか)、リプレイスメントの水準をどう考えるかなどはいろいろな可能性があるというお話。
共通するフレームワークに基づく実践的形態の違いで、FanGraphsのWARとかBaseball ReferenceのWARとかが出てくるわけですね。

WARと言われると複雑そうでよくわからないと感じても、例えばRSAA(=(リーグ平均失点率-失点率)×(投球回/9))になじみがあれば、それをベースに考えることもできます。
比較基準をリーグ平均から控えのレベルに変えて、最後に10で割って単位を得点から勝利に変えれば(フレームワークとしては)WARになります。

最終的に「納得のいく総合評価」にするために細かいところを考えはじめればキリがありませんが、枠組みだけなら簡単ですし、上の式で本質はおさえられます。

守備位置補正の考え方


Visualizing outfield defense and positional adjustments

以前にTwitterのほうにも上げたのですが、WARに出て来る守備位置補正に関する記事。これは守備位置補正の考え方を視覚的に納得してみようという意欲的な内容ですが、わざわざこういった記事が出て来るように、そもそも守備位置補正関係は混乱が見られるようです。たしかにわかりにくい部分です。

少なくとも現在のところ、WARの守備位置補正は、抽象的な意味での難易度や「重要さ」に対するボーナスといったものではないし、そういう雰囲気で考えないほうが理解しやすいというのが当方の捉え方です。そもそも「全守備位置の野手平均」と比較して全ての守備者を評価する守備評価手法があればそれでいいのですが、現実的には守備指標(UZRやDRS)の計算が守備位置ごとでしか出せないので、守備位置を超えて比較するときには埋め合わせが必要になるというだけだと(守備位置補正の概要については過去記事をご覧いただければと思います)。

例えば三塁手の選手が遊撃手にコンバートされたら付与される補正値は上がりますが、(平均的に言えば)ちょうどその分UZRが下がることが見込まれるのであって、最終値であるWARの値は変わりません。補正値を並べたときに遊撃手の値が高いからといってWARが評価の価値判断として遊撃手を優遇しているとか、遊撃手での出場が有利になるとかいうことではないわけです。というよりむしろ、守備位置ごとの変な有利不利が出ないためにこそ補正値が存在します。

ニュアンスを強調するためにちょっと強引な比較を出せば、wOBAでは四球より本塁打のほうが係数が大きいですが、それは統計的事実として本塁打のほうが四球より点になることを単純に反映しているだけであって、特に本塁打が優遇されているとか本塁打を打つ打者が「有利」とは言わないのと同じことです。得点と失点への影響をクールに計量しているだけです。守備位置補正に関しても「三塁手と遊撃手では価値が違うからその分ポイントをあげましょう」というような漠然とした表現よりも、テクニカルなものとして理解したほうが(めんどくさそうだけど、結局は)戸惑いが少ないような気がします。

じゃあ、その適切な値はどうやって計測するのですか、というと難しいのですけどね。個人的には、Tangotigerがやったような守備指標からの導出は、もちろん理想としては正しい道であるものの実際には強引といえば強引だと思っています。そして打撃指標から出すのは、ある種の大胆な割り切りを持てば(数字的にも理論的にも)結構キレイにいくのですが、強引といえば強引だと思っています。

WAR改善に向けた話

『セイバーメトリクス・リポート』『セイバーメトリクス・マガジン』などを発行しているDELTAが2012年、2013年と算出しているWARについて、今後の改修に向けた議論をしたいと思います。
はじめに断っておきますがここでの議論は何らDELTA関係者としてのオフィシャルなものではなく、単なるセイバーメトリクス好きとしてこう変わっていってくれたらいいなぁという検討です。

以下、アメリカのバージョンと区別するためにDELTA社算出のWARをdltWARとします(これも何らオフィシャルな呼び方ではないので注意)。特に挙げている順番に意味はないです。



#1 投手評価をFIPからtERA(tRA)に

個人的には前々から是非ともと考えていたところで、結果的な貢献度の評価指標としてはFIP(BABIPの高低完全無視)よりもtERA(発生した打球の種類までは投手の責任)のほうが望ましいと考えます。SMM2でも打球種別の得点価値が出ており既に日本でtERAの算出自体はできるわけですので、これは単純に置き換えればいいだけかと。


#2 パークファクター補正の導入

いわゆる統一球うんたらかんたらで現在特に取り扱いが難しいところではありますが、投打ともにパークファクターに関する補正はやはり外せないところかと思います。意外とアメリカのサイトや文献でここの計算式をきちんと示しているところって少ない(みんな細かいところは興味ない?)のでどうするか迷う部分も少しありますが、先日整理してみたような形かあるいはplay-by-playデータを使っていいなら、自分は以下のようにやるのもわかりやすいかなぁと考えています。

打者の補正値(wOBAから減算):(ホームでの打席/打席)×(ホームでの両軍合わせたwOBA-ビジターでの両軍合わせたwOBA)

投手の補正値(tERAから減算):(ホームでの対戦打席/対戦打席)×(ホームでの両軍合わせたtERA-ビジターでの両軍合わせたtERA)

これだとよく言われる得点価値の補正に直接的にはならないのですが、得点を直に扱うよりコンポーネントのほうが数が多いので仮に1年だけで見ても相対的に安定した数字が得られると考えられること、リアルな得点をねじ込むよりWARで測定の対象としている指標でPFを測ったほうが論理がスッキリすること、に魅力があると考えています。たしかColin WyersがどこかでこういうリニアなPFの計算を議論していたと思うのですがちょっとどのサイトだったか思い出せず。もちろん得点を試合数で割るやつで普通にやっても全然問題ないのですが。


#3 日本版守備位置補正値の算定

現在dltWARではfWARで利用されている守備位置補正値を少し修正して使う形となっています。守備位置補正の対象となる実態はおそらくMLBとNPBで大勢は変わらないものの同一ということはないと考えられるため、日本に合わせた補正値を出すことが望ましいと言えます。

fWARはTangotigerが守備指標から「捻り出した」補正値を使っていますが、日本では打撃指標の側から補正値を導き出すしかないでしょう。実際的な事情としては打撃指標から補正値を導くのはよくある話ですし、MLBの結果で照らす限りは数字自体そう違ってこないことはわかっています。

このあたりを正当化する理屈としては(荒いのであまり引っ張り出したくないですが)以前このブログで総合評価をする際にも議論していますし、Bill JamesもThe Fielding Bible 2で打撃指標を使った守備位置補正値を出して総合評価に使用しています。またTangotigerのブログでも最近議論があったところで、守備指標からやるべきだという主張ももちろん理解できますが、個人的には守備指標からやるのは理論的には望ましくても実際問題強引になりがちなので打撃指標を使っておくのは必ずしも妥協ではなく積極的な選択でもあり得るかなと考えています。

どのくらいの期間を対象にとって補正値を計算するかですが、一部の選手のパフォーマンスに影響されず一般的な法則のようなものを出したいので、20~30年くらい見たほうがいいのかなと思います。要するにコレなんですが、日本のデータでは外野手を区別して計算するのが最近の数年しかできないんでしたかね。


#4 リリーフ評価にレバレッジを導入

理屈付けに関してはこのブログでも少し議論してきたところですが、リリーフの特性を考えると現在MLBで行われているWARに(LI+1)/2のボーナスを与えるのはまぁ妥当なところだと思います。問題はLI(WE)の数字をどうやって出すかで、個人的には正直ちょっと手に負えないところ。


#5 ベースランニング評価の追加

現状は盗塁・盗塁刺だけの評価となっていますが、走者として安打の間の進塁なども評価されるとより包括的な評価となります。要するにコレができればいいという話で、あとはもうどこまで細かく項目を入れるかだけです。得点としてのインパクトは小さいですし、手間はかかりますけどね……。


#6 UZRのリーグ合計をゼロに

以前からこの辺はどうするべきなのかと思案していたところなのですが、個人的にはdltWARに使われているDELTAによるUZRを特定のリーグ・守備位置について合計したときにゼロにならないのが気になります。パフォーマンスの良し悪しそれ自体ではなくwRAAなどのように相対的な利得の大小を表すRelative系スタッツの性格上「リーグ平均値=0」の性質は外せないかと。

FanGraphsのUZRでは各ゾーンのアウト率の算出は過去6年のデータに基づいているということで、30球団162試合のMLBですら十分に大きなサンプルを確保するために6年のデータ必要ということなのでNPBでもゾーンの基礎データはできるだけ多くのサンプルを集めることが好ましいでしょう。

で、FanGraphsのUZRは6年分の基礎データを使って算出したUZRをその年・リーグの平均が正確にゼロになるように調整しているということですが、そこの計算ロジックは書かれていません(見逃しているだけでどこかに書いてあるのかな?)。というのもwOBA→wRAAを計算するときの打席数にあたるものが必要になるのですが、それが何なのか。BBTFの記事を見るとMGLはUZRにおける「機会」を「獲得アウト数+許安打の責任分」と定義している(player's "chances" in any particular zone is defined as that player's number of outs plus the number of hits he is responsible for. )のでおそらくそういう類の数字を使っているものを推測します。日本でもこれを求める必要があるのでしょう。自分はSMM2の分析でUZRをノーマライズする際、打球ごとに平均的に見込まれる守備位置ごとのアウト獲得数を機会として集計しました。計算は少し違いますが結果はそう変わらないと思います。

ただFanGraphsのデータを見てみるとAL・NLそれぞれでUZRを合計したときにゼロになるわけではなくMLB全体でゼロになるようになっていて、この辺の思想はよくわからないです。平均をセパ合計でとるにしろ分けるにしろ「基礎データを複数年で取って、それから平均をゼロに合わせる」仕組みは必要だと思うのですが、どうも自分が何か勘違いしているところがあるのかなぁ。


#7 打撃評価の解像度向上

このあたりはモデルとして決定的ではなく影響も少ないマイナーなところですが、個人的にBaseball Referenceがやっている「内野安打と外野安打の区別」とか「併殺打回避得点」など一般的なwOBAの式より細かく打撃の内容を見る計算はある程度は重要だし筋に無理もなく、もしデータが出せるなら計算もさほど複雑にならないので好ましいと考えています。併殺打のほうは最高と最低で10点くらい差がつくということですから、本来無視はできないところです。





以上思いつくままに挙げてみました。あとはリプレイスメント・レベルの設定が本当に今のままでいいかとか検討すべき点はあるのですが、多分その辺は掘っても何も出ないというか、計算結果は変わらなさそうな気がしています。


SMM2をもっと楽しむために

先日発売しました『セイバーメトリクス・マガジン2』についてもう少し書きます。

特集の守備企画なんですが、やはり少し難しいのでというお話が編集の秋山さんからあり、ちょっとした解説として岡田さんと私の対談みたいなものが収録されています。

が、まとまりなく好き勝手なことを喋ってしまい(編集に負担をかけたうえ)あまり読み進める上でのガイドになるような内容を残せなかったなぁと反省しております。

そこでこのブログの場を使って、守備企画を読んでいくうえでのガイドあるいは補足あるいは勝手な感想みたいなものを少し書いてみようかと思い立ちました。

多分また大した内容にならないと思いますが、ネタバレをしない程度に自分として感じたポイントなどをつらつらと書きつつリンクなどを貼って周辺の話題を紹介していこうかなと。著者の方が伝えたい大事な内容はもちろん本に書かれているわけですが、こういうところもおさえておくとさらに今回の企画を楽しめるかも、ということで。

※長くなってしまったので適当に拾い読みして下さい。




【UZRに親しむ】

今回の守備企画の基礎には、なんといってもUZRがあります。UZRがわからないと、話全体がわからないことになってしまいます。

セイバーメトリクスの指標って大概は別に数学的に高度なものでもないし、発想のポイントさえ掴めればすぐに理解できるのですが、このUZRに関しては「ちょっと難しい」と思っておいたほうがいいかもしれません。

もちろん高度な専門知識がなければ理解できないとかそんなレベルの話ではないので恐れる必要は全くないのですが、「なんとなく」わかったつもりで流すのではなくて、時間としては30分もいらないのでどこかで一回腰を据えて説明を読みロジックを追うことお勧めしたいのです。

UZRは守備の得失点をうまく表現するために工夫して作られていることが見て取れる内容になっていて、「なんとなく」の理解だとその工夫を見逃してしまいがちかと思います。なので一度きちんと取り組む心構えを持ったほうがいいと思うわけです。例えば緩いゴロが三遊間を抜けたとき、三塁手と遊撃手はそれぞれどう評価されるのか。それが強いゴロだったらどうなるのか。遊撃手が捕球してアウトにしたら三塁手はどう評価されるのか。ただ単に「獲得アウト/ボールインプレー」で評価する場合とどう違うのか。こういったことを説明できることが重要です。

日本語の資料は少ないですがウィキペディアのUZR項目で計算の骨格は掴めると思います。開発者MGLの説明文を三宅さんが翻訳してくれているものもありますのでそちらもお勧めです。

ウィキペディア:UZR

MGLのコラム(三宅さんによる翻訳)


英語の資料ではFanGraphsに掲載されているMGL自身による記事が、仕組みや活用にあたってのポイントなどを網羅していて非常に有益です。

UZR Primer




【守備企画全般について】

UZRはここが本邦初登場というわけではないので今更な部分もありますが

(1)選手の守備力を定量的な基準で比較することができる
(2)守備の得点(失点)の意味での具体的なインパクトがわかり、攻撃や投手のそれと比較することができる
(3)守備全体に点数を割り当てるだけでなく、その中身までわかる

といった点について、改めてすごいなぁと今回のSMM2を読んでいて思いました。なにしろ、(特に日本では)ちょっと前までは「優れた守備者はシーズンで失点をどのくらい防いでいるのか? 100点? 10点? 50点?」みたいな状況だったわけですから。

個人的に5年くらい前は、日本でゾーンレーティングの計測が行われるのなんて20年は先の話だろうと思っていました。現に出ているものを見た後からすると当たり前のようでも、やはりけっこう驚くべきことです。ただ守備の良い悪いを言うだけじゃなくて、これを材料に野球の様々な部分を考えていくことができるはずです。

話が逸れてますね。以下では、分析者の方ごとに分けて、自分が気になったポイント(というか素朴な感想?)をごく簡単に書いてみたいと思います。読む上でのガイドといえば偉そうですが(ネタバレしない範囲で)例えばこういうところが面白いですよね、という話として。



【Student氏参考分析(三塁手)】

いつも仕事の丁寧なStudentさんらしいところですが、データの中身をわかりやすく図と表に出してくれているので、守備について詳細なところがわかるようになっています。ゾーンデータの恩恵がわかりやすく感じられます。

例えばStudentさんの分析を一旦別として、素朴にデータを眺めて何が言えるかを自分なりに考えてみるのも楽しいです。



【morithy氏参考分析(遊撃手・左翼手)】

遊撃手について言えば、ゴロ打球だけでなくエア打球(フライ・ライナー)を分析に含めている点が特徴的です。通常内野手のUZRはゴロだけが対象なので。この点、開発者のMGLはエア打球を含めるのは絶対にダメだと言っているのではなく、含めるほうがいいかもしれないという議論もあります。色々考えてみるのも一興です。

またゴロの分析では三遊間・正面・二遊間という3分割を採用しており、これはフィールディング・バイブルなんかでも見られますがイメージしやすくていいな、と思いました。単純なことですが分析の結果を説明するうえで「この選手は方向EとFの打球に強い」とか言うより「三遊間に強い」と言うほうが圧倒的にわかりやすいですからね。

余談ですがmorithyさんはUZRのデータが得られる以前から守備の分析について野心的な試みを多く行われてきた方です。morithyさんの個人サイトに行くとレンジファクターを改良した系統の評価を往年の選手について見ることができ、小坂の守備がどれだけ凄かったかなんてことがわかったりして非常に楽しいです。未読の方はこの機会にぜひ。

日本プロ野球計量分析レポート&データ集



【岡田氏参考分析(中堅手・右翼手)】

守備範囲が一目でわかるように可視化している点やアームレーティングの内訳が見られる点が「オイシイ」ところですね。

例えば中堅手のアームレーティングの内容を見ていくと、発生する頻度や直接ホームインになるプレーである関係からであると思われますが、二塁走者を単打で生還させるかどうかの部分で選手ごとの差が大きいことがわかります。単に選手ごとの点数が出るというだけでなく、勝敗に影響が大きいプレーは何かというのが定量的にわかるのは野球の知見として重要かと思います。

走者が外野手の肩を警戒して進塁を留まるのは外野手の「貫禄」のような漠然としたものとして扱われてきた感がありますが、冷静に考えれば塁の状況としてリアルに観察できる事実です。そういうことをきちんと観測したら、どのくらい勝敗に影響があるのか? 誰が優れているのか? この辺がわかるようになった意義は大きいなぁと改めて感じました。



【道作氏参考分析(捕手)】

UZRによる原則評価では済まない捕手ですが、結論としては現状出来る範囲で無理のない評価をなさっているという印象です。式は書かれていませんが評価法を文字通りに読めば例えば当方がサイトに出している手法にかなり近いのではないかと思います。

これはかなり個人的な感想なのですが、自分の中に「みんな色々言ってきたけど、結局捕手の評価をどうにかできたんだっけ?」という疑問がありまして、「本音を言うのならば、何か長年の懸案事項が片付いていないことを再確認させられるようなポジションなのだ」という道作さんのコメントには物凄く深く頷いてしまいました。フィールディング・バイブルなんかはかなり頑張って具体的な形も示しているので、そういう頑張りをないがしろにするわけではないのですが。

なお道作さんは個人サイトで以前から捕手の守備評価に関して色々なアイデアを持って挑戦されており、その他コラムでもリードなどについて思索を示しておられるので、合わせて読むと面白いこと間違いなしかと思います。

捕手守備指標(試案)

クレタ人はウソつきだ、とクレタ人は言った。



【三宅氏参考分析(一塁手)】

目次にも出ているので)結論から言うと一塁では浅村が最優秀なのですが、これを「反則技」と称しているのが面白いところです。

普通一塁というのは一塁しか守れないような選手が守るわけですが、他の守備位置を普通に守れるくらい「動ける」選手が入ってくると異常に高い数値が出てしまうと。

守備指標を見ていると、こういうのは外野のレフトとかでよくある話です。レフトはレギュラーに「打てるけど守れない」タイプの選手が多く、そんな中で控えの選手が守備固めでそれなりの出場をしたとき、びっくりするくらいのプラスが計上される場合があります。

外野なら守備範囲の差はダイレクトに被安打に反映されやすそうだし一安打の価値も重いしわかりやすいのですが、これが一塁でも起こったというのが面白いです。一塁手といえば守備の影響が少なそうなので守備の優劣はそれほど語られず打撃力でレギュラーが選ばれる印象がありますが、例えばの話、めちゃくちゃ俊足で動ける選手を一塁手専門として鍛えたら、打撃がたいしたことなくても総合的な利得で他の一塁手を凌駕するようなことがあるんだろうか?(それを狙うのは戦略としてアリなのか?) なんて考えてしまいました。



【蛭川参考分析(二塁手)】

自分のは言及しても仕方がないと思ったのですが、Batted Ballsの評価を組み入れたことについて少し背景を付け加えておこうかと思います。

理論的にはUZRというのは非常によくできた守備指標だと思いますが、現実に計算をするためには打球の性質を細かく記録する必要があります。問題は、その記録って本当に信頼できるの?ということです。出塁したかしてないかみたいに客観的にはっきりした区別で記録できるものではなくて、打球はどこに飛んだか、種類は何か、強さはどうかというアナログな記録ですから、客観的に記録ができるかという疑問が生じたとしても無理もないところです。これは作業担当者の能力やモラルを疑うとかいう話ではなくて、そもそもそういう種類の記録を行うことの仕組みとしてどの程度の正確性・客観性が確保できるのだろうかと。

Colin Wyersが有名な論者ですが、MLBの方面でこの辺は健全な懐疑として言う人は言います。統計にとってバイアス(系統誤差)というのは厄介なもので、もしデータの採り方によって結果にバイアスが含まれるなら、(ランダムな誤差と違って)サンプルサイズを増やしてもこれは解消しません。だったらバイアスがないようなシンプルなデータの採り方(例えば単純にゴロに対する獲得アウトの比率)でやってみて、打球の分布によるランダムな誤差はただサンプルを増やすことで排除すればいいんじゃないの、という考え方もあるわけです。もちろんその場合は5年や10年など長いタームでしか守備指標を出せないですが。

個人的には、アナログだから誤差があり得るといっても三塁手の正面に飛んだ打球が一・二塁間への打球に見えるなんていうことはあり得ないのであって、打球の種類などに関しても、多少の誤差はあっても基本的に実際の分類が「真の分類」の近くに分布していれば結果にそう違いは出ないはずだし、打球がどこに飛んでも分母に数えられるような指標に比べれば守備の働きを表すものとして(完璧ということはないのは前提で)圧倒的に有益だと考えています。

アメリカではField f/xみたいな夢のある話も持ち上がっていますがいずれにせよ一般にオープンなものではありませんし、理想的なシステムが使えない以上はできる手段でなんとか頑張るしかありません。もっと言えば、Field f/xみたいなシステムがあったとしても、目的に対して誤差がゼロということはあり得ませんし正しく機能していることを一般ユーザーがどう確認するのかという話で、この辺の懐疑は言い出せばキリがないというところもあります。そういう中でゾーンのデータを収集する、アメリカで言えばBISなどの努力をただ否定するのも非建設的です。長期で見ればゾーンの情報を使わない守備指標と照らし合わせて結果がデタラメでないか検証していくこともでき、MGLはそのような検証でUZRの有効性を確認しています(フィールディング・バイブル3にて)。

ただ、上記の議論は上記の議論として、あくまで記録の正しさを外部からは確認ができないというのもありますし、系統的な偏りの可能性もあるにはあるので、少なくともゾーンの情報を使わない評価を参考として並べてみる意義はあると思いますし、最終評価を出す際には多少考慮するのもアリ、という考えです。

向き合い方の一例としてTangotigerは、翌年の守備成績を予測しようと思えば「UZR×40%+FRAA×10%+平均値×50%」というような形になるだろうとしていて、このときFRAA(ゾーンの情報を使わない守備指標)はUZRに含まれる観測データのバイアスを除去する働きをする、としています。個人的にもおそらくこのくらいの使い方が妥当なところだろうと感じます。

「なんでこの人はUZRがあるのにアウト/ゴロなんて気にするんだろう?」と思われたかもしれませんが、背景にはまぁそんなような議論が色々とあるわけです。

UZRやDRSのようなゾーンベースの守備指標があり、他方でそれらに対する一種のアンチテーゼとしてBaseball ProspectusのFRAAやTangotigerのWOWYみたいなゾーンを使わない評価手法があるというのは見ていくと面白い点です。



以上ぐだぐだと、原理や方法論の話ばかりで失礼しました。



«  | HOME |  »

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。