Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

セイバーメトリクスQ&A

ふと思ったことなんですが、こうして私のような者のブログを見てくださっているみなさんの中に、「今更聞きづらいけど実はよくわからない、セイバーメトリクスに関する疑問・質問」ってありますでしょうか。セイバー系サイトでは自明のことのように流されてしまっているけどどうも腑に落ちない、とか。

私自身未熟者ですので質問をいただいたとしてもそれにうまくお答えできるかはわからないのですが、何か疑問がありましたら、よろしければコメントで教えていただけますと幸いです。
私が答えられなくても、少なくともこの場所に「セイバーに対する疑問」というラベルがついて載ることになりますので、それについて研究したり回答してくれる方が現れるかもしれません。
「これはくだらない質問かな」などの心配は不要ですし、普段コメントをなさらない方でも堅苦しい挨拶は抜きにして端的に疑問だけ書いていただいて問題ありません。
私の方としては、セイバーメトリクスのどういうところがわかりにくいのだろうかということの参考にしたいという気持ちがあります。


さて、そうはいっても私のブログ程度の集客力ではそうそうコメントも来ないかと思いますので、一種のデモンストレーションとしてまずは自作自演で質問と回答をしてみようかと。ネット上の言説を見ていてこういう点に疑問や混乱があるんじゃないかというところについて、寂しいですがエアーQ&Aです。

※回答は私個人の考えであり、セイバーメトリクス界の一般的な合意を代表するものではありません。また、指標についての説明も必ずしも考案者の意見を反映するものではありません。



Q.何故RC27・XR27は「一人の打者が1番から9番まで打線を組んだら」とかいう無茶苦茶な仮定なの?

A.結果的にそういう説明になるだけで、本質的にはその仮定に意味はありません。
というか、その仮定に沿って計算されてすらいません。
RC27は、選手個人が創出したと評価できる得点数であるRCを、当該選手が消費したアウト数で割って27倍した数字です(以下、RCをXRに置き換えても同じ)。
肝心なことは、RCはそのままでは「量」であり「率」を比較するには何らかの基準で標準化する必要があるということです。これは「安打数」と「打率」の関係と同じです。
だから安打を打数で割って打率を計算するようにRCを打席数で割っても構わないのですが、野球はアウトを消費する間にどれだけ得点を獲得するかを競っているわけですから、得点をアウトで割る方式のほうが野球の構造を捉えていると考えることができます。
そしてRCをアウトで割るだけでも指標としては成立するのですが、そのままでは数字が0.156とか0.207とか馴染みのない数字になるのでチームの平均得点のように見ることができるように27(あるいは一試合の平均アウト数)を掛ける。これでRC27の完成です。
最後の27倍はしてもしなくても選手を比較する上で実質的には何も問題はありません。つまりRC27は「アウトを消費する間にどれだけ多く得点を創出する働きをするか」を比較することが本質であり、それが「27アウトあたり」の数字に変換されているのは便宜的なものであると言えると思います。



Q.何故WARとかひとつの数字で選手の評価を表そうとするの? 色んな数字を見ようよ。

A.「ひとつの数字ではなく色んな数字を見よう」という考えにも欺瞞はあるかと。
WARは選手のさまざまな働きを得点/勝利という画一的な記述で評価し総合する指標です。
こういう「評価を総合する」試みに対して、ひとつの数字で見ようとするのではなく多角的に色々な数字を見ろという指摘はよく見かけます。
しかし、例えば打者の長打率と出塁率をバラバラに見てそれぞれで評価が分かれる場合に、MVPを選ぶように選手を序列付けることはできるでしょうか。できるとして、その仕方は合理的なものになるでしょうか。
なんとなくの感覚で「AはBに長打率でちょっと負けているけど、出塁率で大きく勝っているからAのほうが優秀だ」と判断するなら、統計的に出塁率と長打率がどれくらいの比率で得点に関連しているかで重みをつけて「ひとつの数字」にして(例:GPA)評価するほうが客観的で合理的です。
このような具合に、さまざまな数字を見て評価をするということは結局は主観的な序列(ひとつの指標)を構築するということです。WARは、その「さまざまな数字を統合する」過程に合理性・一貫性を与えるものです。
WARも安打・四球・盗塁・補殺・刺殺などさまざまな事象を勘定に入れているものであり、それを「ひとつの数字で語ろうとするのは間違っている」と批判するのは今ひとつ焦点のはっきりしない話です。
WARの方法に偏りがあるとか漏れている要素が重要だということであればそのことを直接に証明すればいいのであって、「ひとつの数字で語るな」という主張そのものは私にはあまり意味のないものに思われます。
なお、当然ながらこれは現行のWARに瑕疵があるか否かということとは別問題です。



Q.DIPSとFIPってどう違うの?

A.DIPSが元となるコンセプトおよび計算法で、FIPはそれを元に開発されたシンプルな計算式です。
ボロス・マクラッケンという人物がまずDIPSを開発しました。その時点では何段階にも及ぶ少し複雑な計算で投手の被安打数などを「守備が平均的だと仮定した場合の数字」に置き換える計算をし、それらの数字から最終的に守備から独立した防御率を計算しています。
その後トム・タンゴが、そのように複雑な計算をしなくても奪三振・与四球・被本塁打から直接に(しかも本来の計算から見ても極めて正確に)計算できることを発見し、これがFIPとして一般に利用されています。
DIPSは具体的な指標というより守備から独立して投手を評価する概念を表す語としても使用されます。



Q.どうして投手の評価ではBABIPを無視するのに打者はそうしないの? 矛盾では?

A.責任範囲の違いかと。
守備においては安打を防ぐ要因は投手と野手(守備)に分かれています。痛烈なライナーを打たれてしまうことを野手は防げないし、野手が簡単なフライをポロっと落としてしまうことを投手は防げません。このふたつは別々です。ですから安打について投手と守備の責任を分ける何らかの処理が必要となります。
一方攻撃においては、安打に影響する要因は基本的に打席の打者のみです。従って、結果として打球がヒットであろうがアウトであろうがその結果を打者に帰属させることに問題はありません。
ただ偶然の要素が大きい(再現性が乏しい)ことについては打者にも当てはまるので、真の能力を推定する場合や将来の成績を予測する場合にはBABIPについてはやはり特殊な扱いが必要となります(基本的には、一般的な平均値周辺に回帰していくだろうと予測することになります)。



Q.何故なんでもかんでも数字で語ろうとするの? 試合見ればわかるじゃん。

A.セイバーメトリクスは全てを数字で語ろうとする試みではありません。
そうではなくて、数字で何を語ることができるか、また数字で語る場合にはどのようにするのが適切かを探求するものです。
その中で、誰かが「セイバーメトリクスは数字で表せないことまで数字で表そうとする」と感じる場合にはふたつのケースがあろうかと思います。
ひとつはセイバーメトリクス研究者が数字でどこまで語れるかに挑戦する過程で「数字で語れないことまで数字で語ろうとする」状況に実際に陥ってしまっている場合。これは残念な例ですが、それでも挑戦してみなければわからないのですから大事なことではあります。
もうひとつは、実際にはかなりの程度数字で表せるものを「それは数字で表せない」と従来の価値観が勝手に否定している、という場合。
「試合を見ればわかる」といっても、それは見ている側が「わかっていると思っている」だけかもしれません。
「セイバーメトリクスの守備指標はおかしい。何故なら森野がそんなに上手くないのは試合を見ていればわかるからだ」というのは主張とその理由がセットになっているように一見感じられますが、肝心の「森野がそんなに上手くない」の部分は何の証明もなく「私がそう思うからだ」でしかありません。
セイバーメトリクスの側から言えば、そのような点に確認が必要な場合も多いかと思います。少なくとも、守備指標の事例で言えば、周辺に飛んできた打球は高い割合でアウトにするという事実が示されているわけですから。



コメント

こんにちは。大雑把に言って、盗塁成功率は何%くらいで損得が釣り合うのかというのは個人的に気になりますね。

はじめまして
ベースボールラボからブログ主様のことを知り、学生とのことだったので質問させていただきたいです
セイバーメトリクスの質問とはちょっとずれてしまいますが、大学でおなじようにセイバーメトリクスの話ができる人はいますか?
いないとしたら、普段友達と野球の話をするときってセイバーメトリクスの話を持ち出したりしますか?
僕も学生ですが文系ということもありあまり統計的なことには興味をもってもらえないのでどうされてるか気になります

スラッガー11月号に記載があったシークレットソースについて、もう少し詳細まで知りたいのですが教えて頂けますか?

こんにちは。
「9回を任せるクロ―ザーよりも、7回や8回のセットアッパーの方が大事」という説を最近よく耳にするようになりましたが、これはどういった根拠から生まれた説なのでしょうか?
それと、こちらはセイバーメトリクスとは直接関係ある質問ではないのですが、ベースボールラボの各著者様のコラムや分析データの更新がしばらく止まっていますが、今後新たに更新する予定はなくなったのでしょうか?
統一球の影響についての検証や、今季の日本版UZRの公開などベースボールラボでしか知ることができないだろう様々なコラムの更新を楽しみにしていたので、更新が再開されることを祈っております。

返信が遅れてすみません。みなさんコメントありがとうございます。
後日回答を試みたいと思います。


>とあるヤクルトファンですさん

個人的な内容ですのでここで。
結論から言いますと、リアルでセイバーメトリクスの話をできる仲間はいません。
野球が好きで、中でもデータが好きだということくらいは話すことはありますが
相手が「データかぁ、俺も打点や得点圏打率はいつも気にしてるよ」といった反応をしたときに
それに乗っかるのは抵抗ありすぎるし長々と「そうじゃない」という話をしてもお互い得をすることはなさそうだなと感じてそこまでになってしまいます。
大学に入った当初は「変わった趣味アピール」も兼ねてではないですが
セイバーメトリクスというものを自己紹介でちらっと話してみたりもしましたが
まぁ反応ゼロなので、早々にあきらめましたw
また試合を見ているときなどはそれほどセイバーメトリクスの観点で見たい・語りたいと思う人間ではないので、そういった点では特に葛藤もないです。

はじめまして
せっかくなので質問させていただきます。
セイバーメトリクスにおいて、進塁打というのは評価されているのでしょうか?
前々から疑問に思っていたので、お答えいただければ幸いです。

投手の評価に披OPSだとか、野手の評価にDIPSとかFIPの打者版みたいなものって探せばあるのかもしれませんがあまり見かけないのは何か理由があるのでしょうか。「野手が簡単なフライをポロっと落としてしまうことを投手は防げません。」と言うのが理由でしょうか?確かにBABIPは打者の方に責任が多いらしい気はするのですが、打者側も守備者の影響を受けることに変わりはないような・・・?
長文かつ曖昧な文ですみません。

コメントありがとうございます。なかなか書く時間を取れず恐縮ですが、ご質問には答えたいと思います。

>sekakyuさん

Baseball Labについてはここでお答えしておきます。
詳しいことを勝手に喋るわけにはいかないのですが、内部の体制が変わって再開の予定です。
予告なく更新が止まっておりますこと、関係者の一人としてお詫び申し上げます。


>投手の被OPS、打者のDIPS

これにつきましてはどうしてBABIPの扱いが投手の評価と打者の評価で異なるのか、という論点に集約されますので、結局は今回の記事に書きましたBABIPについてのQ&Aと同じ話になるかと思います。
打者については結果的にどのように得点に影響したかのパフォーマンスを評価するのであればBABIPを云々する必要はない一方、潜在的な実力や将来の成績を予測するような場合、本塁打・三振・四球を中心に評価をすることは行なわれます。実際このあたりはわかりにくい部分だとは思うのですが、そもそも「何を評価したいのか」によって合理的なプロセスは変わるということを押さえていただけると多少話が見えやすくなるかなと思います。
投手の被OPSをわざわざ計算しない理由を端的に申し上げると
そもそもOPSやRCなどは得点に近似をすることが目的として存在するわけですが
投手に関しては最初から失った得点の記録である防御率あるいは失点率が存在する以上計算する意味がないからです。

いずれも拙コラムですがBABIPについては
http://www.baseball-lab.jp/column_detail/&blog_id=8&id=72
被打撃成績による投手評価については
http://baseballconcrete.web.fc2.com/alacarte/whip.html
あたりをご覧頂けると多少参考になるかもしれません。

WARでは守備の負担感によっても補正していますが、数値の根拠はどこにあるのか?もしわかれば教えください。



C : +12.5 runs
1B: -12.5 runs
2B: +2.5 runs
3B: +2.5 runs
SS: +7.5 runs
LF: -7.5 runs
CF: +2.5 runs
RF: -7.5 runs
DH: -17.5 runs

ご質問ありがとうございます。答えられておらず、すみません……。時間が取れましたら自分なりに書いてみようと思います。

ブログやHPにもよくお邪魔し 本も購入させてもらいました。



お陰でそれなりの理解を得たのですがどうしても WARのベースランニングのところがわかりません。



盗塁やパスボール ワイルドピッチ等も含めた出塁後のベースランニングを得点換算した指標だとは思いますが、



ブラウンという選手がいます。盗塁成功率も高く おまけに XBH率も非常に高い。しかしなぜベースランニングの指標がfangraphsもreferenceも低いのか?



ハンターは盗塁も少なければXBH率もそんなに高くない。しかしなぜか異様にベースランニングの評価が高くなっているのでさっぱりわからなくなりました。



最初はハンターは盗塁は少なくても ベースランニングの能力があるから ブラウンのように30以上も盗塁を稼がなくても 数値は高いんだ。きっとブラウンはXBH率が低くハンターは高いのだろう。そう推測していたのですが、盗塁もXBH率もブラウンが圧倒。



しかしなぜブラウンが平均レベルなのか?走者としてあれだけのSB成功率とXBH率が高くてなぜ なのか?もしご存知であればお願いします。



ベースランニングのWARの部分がわからなくなりました。是非教授ください




>沖さん

メールもいただいていたのに返信が遅くなりました。
書籍の購入等ありがとうございます。

ご質問のWARベースランニングの件ですが
指標のシステムとして言えば、WARの走塁評価は
走者として出ていて打球が飛んだときに
安打やゴロなどで多く進塁できたか否かによって評価されます。

従って走塁評価が低いのであれば
例えば一塁走者で出ていて単打が飛んだときに
三塁に進塁できた機会が少ないとか
そういった部分で結果が残せなかったことになります。
Fangraphsなら指標の説明は下記URLに御座います。
http://www.fangraphs.com/blogs/index.php/ultimate-base-running-primer/

もっともそういった一般論はご承知かと思いますが
その上で俊足なのに評価が低いケースがある、ということについては
詳細な計算過程までオープンにされているわけではないですし
技術論に絡む部分もあるかと思いますので私からはなんとも申し上げられないですね。

ただB-RについてはBattingのMore Statsなど見ていくと
一塁走者で単打が出た機会が何回あってそのうち何回三塁へ進んだか
なんてデータが見られたりするので、そのあたりを分析していくと何かわかるかもしれないですね。

クロスケ

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/513-9dc73116

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ