Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

セイバーメトリクスQ&A

ふと思ったことなんですが、こうして私のような者のブログを見てくださっているみなさんの中に、「今更聞きづらいけど実はよくわからない、セイバーメトリクスに関する疑問・質問」ってありますでしょうか。セイバー系サイトでは自明のことのように流されてしまっているけどどうも腑に落ちない、とか。

私自身未熟者ですので質問をいただいたとしてもそれにうまくお答えできるかはわからないのですが、何か疑問がありましたら、よろしければコメントで教えていただけますと幸いです。
私が答えられなくても、少なくともこの場所に「セイバーに対する疑問」というラベルがついて載ることになりますので、それについて研究したり回答してくれる方が現れるかもしれません。
「これはくだらない質問かな」などの心配は不要ですし、普段コメントをなさらない方でも堅苦しい挨拶は抜きにして端的に疑問だけ書いていただいて問題ありません。
私の方としては、セイバーメトリクスのどういうところがわかりにくいのだろうかということの参考にしたいという気持ちがあります。


さて、そうはいっても私のブログ程度の集客力ではそうそうコメントも来ないかと思いますので、一種のデモンストレーションとしてまずは自作自演で質問と回答をしてみようかと。ネット上の言説を見ていてこういう点に疑問や混乱があるんじゃないかというところについて、寂しいですがエアーQ&Aです。

※回答は私個人の考えであり、セイバーメトリクス界の一般的な合意を代表するものではありません。また、指標についての説明も必ずしも考案者の意見を反映するものではありません。



Q.何故RC27・XR27は「一人の打者が1番から9番まで打線を組んだら」とかいう無茶苦茶な仮定なの?

A.結果的にそういう説明になるだけで、本質的にはその仮定に意味はありません。
というか、その仮定に沿って計算されてすらいません。
RC27は、選手個人が創出したと評価できる得点数であるRCを、当該選手が消費したアウト数で割って27倍した数字です(以下、RCをXRに置き換えても同じ)。
肝心なことは、RCはそのままでは「量」であり「率」を比較するには何らかの基準で標準化する必要があるということです。これは「安打数」と「打率」の関係と同じです。
だから安打を打数で割って打率を計算するようにRCを打席数で割っても構わないのですが、野球はアウトを消費する間にどれだけ得点を獲得するかを競っているわけですから、得点をアウトで割る方式のほうが野球の構造を捉えていると考えることができます。
そしてRCをアウトで割るだけでも指標としては成立するのですが、そのままでは数字が0.156とか0.207とか馴染みのない数字になるのでチームの平均得点のように見ることができるように27(あるいは一試合の平均アウト数)を掛ける。これでRC27の完成です。
最後の27倍はしてもしなくても選手を比較する上で実質的には何も問題はありません。つまりRC27は「アウトを消費する間にどれだけ多く得点を創出する働きをするか」を比較することが本質であり、それが「27アウトあたり」の数字に変換されているのは便宜的なものであると言えると思います。



Q.何故WARとかひとつの数字で選手の評価を表そうとするの? 色んな数字を見ようよ。

A.「ひとつの数字ではなく色んな数字を見よう」という考えにも欺瞞はあるかと。
WARは選手のさまざまな働きを得点/勝利という画一的な記述で評価し総合する指標です。
こういう「評価を総合する」試みに対して、ひとつの数字で見ようとするのではなく多角的に色々な数字を見ろという指摘はよく見かけます。
しかし、例えば打者の長打率と出塁率をバラバラに見てそれぞれで評価が分かれる場合に、MVPを選ぶように選手を序列付けることはできるでしょうか。できるとして、その仕方は合理的なものになるでしょうか。
なんとなくの感覚で「AはBに長打率でちょっと負けているけど、出塁率で大きく勝っているからAのほうが優秀だ」と判断するなら、統計的に出塁率と長打率がどれくらいの比率で得点に関連しているかで重みをつけて「ひとつの数字」にして(例:GPA)評価するほうが客観的で合理的です。
このような具合に、さまざまな数字を見て評価をするということは結局は主観的な序列(ひとつの指標)を構築するということです。WARは、その「さまざまな数字を統合する」過程に合理性・一貫性を与えるものです。
WARも安打・四球・盗塁・補殺・刺殺などさまざまな事象を勘定に入れているものであり、それを「ひとつの数字で語ろうとするのは間違っている」と批判するのは今ひとつ焦点のはっきりしない話です。
WARの方法に偏りがあるとか漏れている要素が重要だということであればそのことを直接に証明すればいいのであって、「ひとつの数字で語るな」という主張そのものは私にはあまり意味のないものに思われます。
なお、当然ながらこれは現行のWARに瑕疵があるか否かということとは別問題です。



Q.DIPSとFIPってどう違うの?

A.DIPSが元となるコンセプトおよび計算法で、FIPはそれを元に開発されたシンプルな計算式です。
ボロス・マクラッケンという人物がまずDIPSを開発しました。その時点では何段階にも及ぶ少し複雑な計算で投手の被安打数などを「守備が平均的だと仮定した場合の数字」に置き換える計算をし、それらの数字から最終的に守備から独立した防御率を計算しています。
その後トム・タンゴが、そのように複雑な計算をしなくても奪三振・与四球・被本塁打から直接に(しかも本来の計算から見ても極めて正確に)計算できることを発見し、これがFIPとして一般に利用されています。
DIPSは具体的な指標というより守備から独立して投手を評価する概念を表す語としても使用されます。



Q.どうして投手の評価ではBABIPを無視するのに打者はそうしないの? 矛盾では?

A.責任範囲の違いかと。
守備においては安打を防ぐ要因は投手と野手(守備)に分かれています。痛烈なライナーを打たれてしまうことを野手は防げないし、野手が簡単なフライをポロっと落としてしまうことを投手は防げません。このふたつは別々です。ですから安打について投手と守備の責任を分ける何らかの処理が必要となります。
一方攻撃においては、安打に影響する要因は基本的に打席の打者のみです。従って、結果として打球がヒットであろうがアウトであろうがその結果を打者に帰属させることに問題はありません。
ただ偶然の要素が大きい(再現性が乏しい)ことについては打者にも当てはまるので、真の能力を推定する場合や将来の成績を予測する場合にはBABIPについてはやはり特殊な扱いが必要となります(基本的には、一般的な平均値周辺に回帰していくだろうと予測することになります)。



Q.何故なんでもかんでも数字で語ろうとするの? 試合見ればわかるじゃん。

A.セイバーメトリクスは全てを数字で語ろうとする試みではありません。
そうではなくて、数字で何を語ることができるか、また数字で語る場合にはどのようにするのが適切かを探求するものです。
その中で、誰かが「セイバーメトリクスは数字で表せないことまで数字で表そうとする」と感じる場合にはふたつのケースがあろうかと思います。
ひとつはセイバーメトリクス研究者が数字でどこまで語れるかに挑戦する過程で「数字で語れないことまで数字で語ろうとする」状況に実際に陥ってしまっている場合。これは残念な例ですが、それでも挑戦してみなければわからないのですから大事なことではあります。
もうひとつは、実際にはかなりの程度数字で表せるものを「それは数字で表せない」と従来の価値観が勝手に否定している、という場合。
「試合を見ればわかる」といっても、それは見ている側が「わかっていると思っている」だけかもしれません。
「セイバーメトリクスの守備指標はおかしい。何故なら森野がそんなに上手くないのは試合を見ていればわかるからだ」というのは主張とその理由がセットになっているように一見感じられますが、肝心の「森野がそんなに上手くない」の部分は何の証明もなく「私がそう思うからだ」でしかありません。
セイバーメトリクスの側から言えば、そのような点に確認が必要な場合も多いかと思います。少なくとも、守備指標の事例で言えば、周辺に飛んできた打球は高い割合でアウトにするという事実が示されているわけですから。



スポンサーサイト

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。