Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

セイバーメトリクスQ&A(3)

あけましておめでとうございます。
最近更新のペースが鈍く、今年もあまり加速しそうにはありませんが、なんとかやっていきますのでよろしくお願いします。

さて、新年一発目は、相変わらず答えるほどの知識があるわけでもないのにQ&Aです。読んだ方が何かしら得るキッカケになれば、ということで、いただいた質問に加えて前に書いておいた自作自演の項目も加えて。

毎度の注意書きですが回答は私の理解・解釈であり、セイバーメトリクス界の一般的な合意を代表するものではありません。また、指標についての説明も必ずしも考案者の意見を反映するものではありませんのでその点ご了承下さい。






Q.「シークレットソース」とは?

A.Baseball Prospectus社が示したポストシーズンにおける重要な要素3つのことですね。
BPの分析では、ポストシーズンの成功に関係する基本的な要素は以下だとしています。

・投手の奪三振率
・野手の守備力
・クローザーの能力

Baseball Between the Numbersという書籍に収録されている論文では、まずポストシーズンの成功をポイント方式で定義し(大雑把に言えば勝っていくほどにポイント加算)、そのポイントとレギュラーシーズンの成績にどのような関係があるかを統計の相関分析によって見ています。
その結果、レギュラーシーズンの得点能力はポストシーズンの成功と相関がない一方、失点阻止能力は弱いながら相関があると示されています。
そしてさらに失点の阻止を内容別に見ていくと、被打率とクローザーの成績が特に相関しています。
最終的に安打を防ぐということを個別の働きレベルに分解すれば「投手が三振を奪うこと(そもそも打球を飛ばさないこと)」と「野手が打球をアウトにすること」に分けられる、というわけです。

何故これらの要素がポストシーズンにおいて相対的に重要になるか、ということに関しては完全にはっきりはしていません。
しかしBPの論文では、(短期決戦がどうというより)ポストシーズンでは「悪いチーム」はそもそも存在せず「攻撃が普通で守備が優れたチーム」と「攻撃が優れていて守備が普通のチーム」しかいないことを指摘した上で野球の攻撃が非線形の構造をしていること、投手の支配力などがその条件に関係してきて結果的な傾向が表れたのではないかという仮説が示されています。
クローザーについては、ポストシーズンは短期決戦であるためレギュラーシーズンに比べてクローザーを重用することができることからその能力が相対的に重要になるということは比較的に容易に説明できるのではないかと思います。

最後に注意事項ですが、いわゆる「シークレットソース」の3要素はレギュラーシーズンに比べてポストシーズンでは重要度が相対的に、微弱ながら高いらしいということが示されているにすぎず、ポストシーズンになったら急にこれらの要素が試合を支配するというわけではありません。言うまでもなく打撃も重要であり、重要度が相対的に少し下がるらしい、ということにすぎません。これらの3要素が優れていたとしても、それ以上に優れた打撃力を持つチームに対すれば当然ながら敗れる確率のほうが高くなるでしょう。
またBPの分析結果はいわゆる「スモールボール」の概念とは直接関係はなく、攻撃スタイルとしてはスモールボールがビッグボールに比べてポストシーズンに有効であることの有意な統計的根拠はないとされています。



Q.WARにおける守備位置補正の根拠は?

A.守備指標によって測定される守備位置ごとの格差です。
具体的には、FanGraphsのWARではTom Tangoが提出した補正値を基にしています。
この補正値の原則的な導き出し方は、複数の守備位置を守った選手の守備指標(UZR)の比較です。
例えば一塁手としてUZRが+4である選手が三塁を守ったときのUZRが-6である場合、三塁は一塁に比べて10点分難しいらしいということがわかります。一人の選手のサンプルでは何も言えませんがこのような例について大量のサンプルを集めてあらゆる守備位置同士を比較していくと、守備位置を移動したときに守備指標がどのように悪化するかの一般的な傾向がわかります。そのように集積したものが補正値となります。

意味をわかりやすく理解するための思考実験としては、守備位置というものに関係なく仮想的に「まったく平均的な野手」がいると考える方法があります。その彼があらゆる守備位置を一通り守っていった場合、全体としてのUZRは±0です。
ここで、彼が遊撃を守った場合、UZRは-7.5になります。遊撃守備はそれだけ難しく、一般的に優れた守備者が守っているということです。逆に一塁を守った場合+12.5となります。
これを実際の各守備位置の選手の側から見ると、異なる守備位置の選手達を「野手全体の平均」という一定の視座から平等に比較するためには、遊撃手のWARには7.5を足し一塁手のWARからは12.5を減じる必要があります。UZRをはじめ基本的に守備指標は各守備位置の平均と比較した数字を算出するものであり遊撃手は全体として±0となりますが、遊撃という守備位置そのものが野手全体(の平均)から見れば+7.5の価値があるからです。
このような補正は単に抽象的な意味での難易度を表しているわけではなく、実利的なものです。例えば平均的な遊撃手を失ったチームが平均的な野手でその穴を埋め合わそうとすれば、失点が理論的には7.5増大することになる、という具体的な損得の値を示しているからです。

算出に関してもう少し付け加えておきますと、実際にはサンプルの質・量の関係で守備指標だけでキレイに補正値を出すことは難しいです。そのため補正値の算出にあたって部分的に打撃指標を援用したり(FanGraphsの補正値にもおそらくこの性格があるかと)、そもそも守備位置ごとの打撃指標の差をもって守備位置補正とするということもWARの算出においては行われます。

蛇足ですが、補正値はさまざまなサンプルのばらつきを均した結果の漠然とした「一般的な傾向」に過ぎず、実際に選手を動かしたときにどうなるかは具体的なケースによるはずで、その点では守備位置補正はWARにおける最も大きな欺瞞のひとつであるかもしれない、と個人的には思います。10何点かポイントを与えて「補正」したとしても、捕手と外野手を同一の序列で比較するということがそもそもナンセンス、という立場もあり得るでしょう。もっとも、最初からあきらめるのではなく突き詰められるところまで突き詰めてこのように具体的なものを提示することには非常に意味があると思います。問題は、それをどう扱うかに関してはただ鵜呑みにするのではなくて指標の知識を持った上で適切に扱わなければならないということでしょう。



Q.守備指標って信頼できないよね?

A.「信頼」の意味によります。
こういう場合の「信頼」という言葉には、統計学的にはふたつの意味があると考えられます。
ひとつはその数字が測定したいものをきちんと表していること(妥当性)。例えば投手の球速の速さを測るのに「速い投手は三振が多いはずだ」と奪三振率を使うのは論理が飛躍しており、目的とする要素がうまく測れません。平均球速を用いるほうが妥当でしょう。
もうひとつは、その数字が少ない誤差で選手の能力を表すこと(信頼性)。例えば打者のBABIPは長期的には打者の安打を打つ能力を表すと考えられますが短期的には変動の大きい数字です。
さて守備指標ですが、とりあえず代表としてUZRで考えてみましょう。
まず妥当性ですが、これは問題ないと思います。打球をアウトにすることが守備の原則的な働きであり、それが主観的にどう評価されようが、多くアウトを奪って失点の阻止に貢献しているならそれで問題ありません。バイアスを避けるための多くの補正もあります。
次に誤差の意味での信頼性ですが、これが問題になる場合が多いでしょう。「UZRの数字は3年で見なくちゃいけない」などとも言われます。
しかし重要なのは、どんな指標でも「真の能力」に対する誤差はつきものということです。問題はそれが定量的にどれくらいなのかです。
守備指標に比べて信頼性が高いとされる打撃の指標(例えばOPS)でも、1年間で必ず打者の真の能力と数値がぴたりと一致するものではありません。
1年分のUZRは完全にダメだけど3年分のUZRならば急に完全に信頼できるようになるわけでもなく、1年分のUZRには1年分のUZRなりの、3年分のUZRには3年分のUZRなりの信頼性があります。
ですから信頼性がある・ないの二分割で考えるのはそもそも無理ですし不適切ということです。
指標の信頼性はサンプルの量に応じて、またそもそも何を言おうとしているかの目的に応じて考える必要があります。
守備については、守備指標で全てを正確に表すことは到底できないけれども、守備指標で語れることも多い、というのが私の個人的な立場です。



Q.セイバーメトリクスの戦術論って平均で語るから意味なくない? 実際には個別の事情が多様なわけだから。

A.さまざまな状況を踏まえた解析ももちろんあります。
塁・アウト状況別の得点期待値だけでなくイニングも変数に含めた勝利期待値などは戦術を考える上で活躍しています。
また、投手と打者の個別の力関係を勘案して個別の期待値を算出することも可能であり、犠打はどのくらい貧弱な打者の場合有効か、といった研究もあります。
ただし原則として統計は集団を対象とするもので、個別事例に適用しにくいのは事実でしょう。
しかしそれに関しても、ケースバイケースとばかり言っていないで平均や全体の傾向を知ることも大事だということは言えます。
平均した数字だから個別とは関係ないと言うときに、本当に平均で対応できないと検証されたのかどうか。長期的には「長期的にはこうなる」という傾向に当てはまることから避けられないのも事実です。
頭の中で根拠なく「これは平均とは関係ない」と思っているだけなのではないか、ということには注意が必要ではないかと。


Q.監督を評価する指標はないの?

A.現状、直接的かつ包括的に監督を評価する指標は存在しないと思います。
ピタゴラス勝率と実際の勝率を比較して「戦力的にはもっと勝てているはず」などの評価を行う向きが一部にはありますが、私はこの評価法が監督の評価として意味のあるものだとは考えていません。
また別のやり方は犠打や盗塁の数など個別の戦術の要素を抜き出して「成功率が低いのに盗塁をさせすぎている」などの評価を与える方法ですが、これも監督が総合的にチームにどのような影響を与えているのかを教えてはくれません。



Q.精神論を否定していいの?

A.セイバーメトリクスは取り立てて精神論を否定してはいません。
精神論で語られているような側面がスポーツにおいて重要であることはセイバーメトリクス愛好家も全く否定しないところだと思います。野球は人間が行うスポーツですから。
むしろ当たり前に重要であり、その問題は結果的に優れたパフォーマンスを残せたか(良い記録を残せたか)に収束することから、直接にそれを取り上げて議論する必要がないということではないでしょうか。
否定しているとすれば「なんでもかんでも精神論で語ろうとする姿勢」かもしれません。従来精神論や「数字で表せないこと」として語られてきたものが、実は数字で合理的に説明できる例は多いです。
あるいは「流れ」などについても、プレーしている選手がそれを重視するのは自由ですが、語られてきたような効果が実際には発生していないことが事実として証明できる例もあります。



コメント

何度も同じような質問をして申し訳無いのですが、投手と守備者と打者の責任範囲について、「痛烈なライナーを打たれてしまうことを野手は防げないし、野手が簡単なフライをポロっと落としてしまうことを投手は防げません。このふたつは別々です」と「安打に影響する要因は基本的に打席の打者のみです」という事がいまいちわかりません。これだと「打者の打球の質」に加えて「守備者のプレーの質」も打者の責任になってしまう気がするのですが違いますか?
書いている途中に思ったのですが、投球の質が打者の責任範囲外であることや打者の質が投手の責任範囲外であることなんかと同じ話ですかね?

あくまでも結果的なパフォーマンスをどう評価するかのお話です。
攻撃側チームの視点と守備側チームで視点をきっぱり分けてみてください。

攻撃側チームからすると、1番打者が打った安打はどうやっても1番打者のものであって、その責任の一部が2番打者に関わってくることはありません。
ある打席における攻撃側の要因は(基本的に)一人だということです。これが「安打に影響する要因は基本的に打席の打者のみです」の意味です。
この場合結果的なパフォーマンスの観点からは安打の責任を誰が負うかということを考える必要がそもそもないわけで、攻撃側としては安打は打席の打者に100%帰属し、打者はOPSなどにより発生した結果全体から評価することになります。

それに対して守備側は、打たれた安打に関して、投手の責任と野手の責任が混在しています。ひとつの打席においても複数の要因が関わっています。
ここで発生した安打の責任をどう「分配」するかという(守備に固有の)問題が生じます。
だから投手を守備に影響されない三振・四球・本塁打だけで評価しようではないか、といった動きが出て来るわけです。

以上がパフォーマンスを評価する際に打者と投手でBABIPの扱いが違うことの理由の私なりの解釈なのですが、やはりわかりにくいでしょうかね。
繰り返し言いますとこれは「真の能力」の類を考えるのとは少しレベルの違う話です。
打者の結果にも相手守備の影響があることはもちろんですが、それはどの打者にもだいたい同じように起こり得ることであって、首位打者を表彰するときにいちいち守備のファインプレーに阻まれた度合いを云々しないのと同じようにとりあえず優れた結果(OPSなど)を残したと評価するときにはそれはそれとしておきます。
一方守備で野手が簡単なフライを落としてしまったことを投手の責任にするのは、運不運以前に他人の責任を投手になすりつけるというお門違いな話であるため、これを避けます。

学校で論文を書くことになり、私は「2000年に入ってからの巨人の大型補強は成功しているのか」というテーマで書きたいと思っています。
やりたいこととしては巨人の大型補強で迎えられた選手の契約内容と、その選手の成績をセイバーメトリスク的観点から分析したものでその選手のコストパフォーマンスを算出して、それが巨人のリーグ成績とどのような因果関係があるかを調べるといったことです。
ただ実際に評価するにあたって、貢献度と年俸の関係性を表す指標が存在せず困っています。そこで「評価したい選手の年俸が所属球団の総年俸の何%をしめるのかを調べ、次にその選手のRCが球団の総得点の何%をしめているのかを調べてみる」という指標を自分なりに考えてみたのですがどうでしょうか?
また選手のコストパフォーマンスを割り出せる指標などがもしあったら教えてください。

>巨人ファンさん

面白い研究をなさっていますね。

> そこで「評価したい選手の年俸が所属球団の総年俸の何%をしめるのかを調べ、次にその選手のRCが球団の総得点の何%をしめているのかを調べてみる」という指標を自分なりに考えてみたのですがどうでしょうか?

筋は通っていると思います。前提としてRCだと対象を野手に限定することになると思いますが。

コストパフォーマンスを割り出せる指標、ということですが、指標というよりそれこそRC的な方法で選手の価値を算出してそれを年俸と比較するという試みは一部で行なわれています。ただ、理想的には単にRCではなく選手の価値を総合的に評価すべきであるため、その手順は非常に煩雑になります。具体的にはWARというんですが、日本ではこれを算出するだけで大仕事になってしまいます(このブログでも「2010年度総合評価」のカテゴリーを見ていただけるとどういうものかわかるかと)。

選手の価値を算出する指標としてそこまで手間のかからない代替案としてはVORPという指標がかなり有力だと思いますが、日本で紹介や算出をしているところはほとんど見かけないんですよね。
http://en.wikipedia.org/wiki/Value_over_replacement_player

FIPの低い素晴らしい投手ほど BABIPも低いという傾向は見られるものでしょうか

あるブログでそう書いてありましたが 半信半疑のために質問します

また打者でも一般にはBABIP300ですがイチローのような350というのはレアなケースであるとお考えですか

>沖さん

そのような傾向は基本的に見られません。
2001年から2010年までの間に対戦打席数300以上投げた745人の投手を対象にした場合、FIPとBABIPの関連性は、一方が上がれば他方も上がるという相関関係を示す指数である決定係数で0.007です。少なくともこの区切りのデータについてはほとんど全く相関がないと言っていいでしょう。

そもそも、奪三振・与四球・被本塁打といった守備から独立した項目には投手ごとにそれなりに一貫性があるけれどもBABIPはそうではないというのがDIPSの根本的な考え方としてあるわけです。であれば奪三振・与四球・被本塁打から計算されるFIPはそれなりに一貫性があるはずであり(これは実際そうです)、BABIPがFIPに相関しているのであれば、BABIPにも一貫性が生じるはずです。しかしそれではそもそものDIPSの発見と矛盾であり、FIPとBABIPの間に少なくとも強い相関は存在しないことは実はデータから調べるまでもなくわかります。もちろん奪三振率・与四球率・被本塁打率それぞれもBABIPとほとんど相関はありません。

一部の優れた投手の事例を抜き出してみればFIPもBABIPも明らかに良い(あるいはその逆)、という例は観察されるかもしれませんが、それは後から事例を選択した場合の一種の結果論であり、一般的な傾向ではありません。

打者のBABIP.350については、短い期間を対象とする場合を除けばレアケースだと思います。

ありがとうございます。やっぱりあの記事は出鱈目であったと。

BABIPでいうと 打者BABIPと投手BABIPの標準偏差に差が見られます。投手BABIPの方が明らかに小さいのですが この要因に思い当たることはありますか?

また、投手BABIPが終身で280~320程度に収まっているというのは誤差と考えていいでしょうか?

さすがにイチローの場合はサンプル数も多く 運ではなく実力であると考えていますが如何でしょうか

打者BABIPですとイチローよりもまだ上の選手もいます。

投手のWARとBABIPの相関関係は 実際にファングラフで調べてもほぼないように見えましたが、打者の場合は

http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=1500&type=8&season=2011&month=0&season1=2000&ind=0&team=0&rost=0&players=0

打者ここ5年 1500打席以上で調べると WARと打者BABIPにはそこそこ相関関係があるように見えてしまいます。

上位者はほとんどが300超えていますが 下位者は300を割っている人多いですがどうでしょうか?サンプルに問題があるかもしれませんし忌憚のないご意見お願いします

打者Babipの標準偏差がなぜか投手に比べて大きいことと言い、もしご意見があればお願いします。

イチローのように実働11年やって投手のBABIPが250の投手などまずいないでしょうから。

続けざまに質問 お願いします

投手の守備力で牽制アウトとはZR系ではどのように評価されるのでしょうか

牽制アウトを現すスタッツの名前は 三振でいうKのような表記はありますか

>沖さん

出鱈目かどうか、というよりも、データについて語る際に重要なのは
定義や資料などを明確にした上で具体的に、定量的に事実を述べることだと思います。
どのようなデータを対象にするかによって得られる傾向は変わりますし
同じデータの相関係数0.30に対して「どうやら相関があるらしい」と言う人もいれば「実質的に相関はないようだ」と言う人もいる、ということもあり得るでしょう。


1.打者BABIPと投手BABIPの標準偏差の違い

打者は、最終的に打球の強さを決める要因や
BABIPの上昇に有利に働く足の速さなどの要素、すなわち自分自身の能力が
一貫してBABIPに反映されます。
これに対して投手は足の速い打者や遅い打者などさまざまな打者と対戦し
それらの要素が分散されるため、平準化されるのではないでしょうか。
当たり前の話なんですが、イチローのBABIPを決めるのは常に
イチローのバットコントロール・イチローの走力であるのに対して
他球団の投手のBABIPの決定に占めるイチローの割合はせいぜい数パーセントですよね。

2.投手BABIPが終身で280~320程度に収まっているというのは誤差か

投手のBABIPの通算レベルでのばらつきが運か実力か、という意味のご質問であれば
運に加えて実力の違いというものもあると思います。その詳しい割合ははっきりしませんが。
また面白いことですが、DIPS理論が「投手のBABIPは長期的には一定の水準に収斂していくものだ。短期間のばらつきは運だ」と主張すると、だったら長期的にはわざわざBABIPを標準化した評価式であるDIPSを計算しなくても普通に防御率でいい、ということになります。

3.イチローのBABIPは実力か

主観的にはそうだと思います。
「主観的には」というのは、いくらサンプルが多く偶然である確率が低いといっても
無数の選手がプレーした中から事後的に成功例を抜き出しているのでその判定の客観性というか、統計的な意味には限界があると思うからです。
コイントスで10回連続表が出た例を見れば偶然ではないと思えてくるかもしれませんが、10回の試行が1,000回くり返された中で出てきた一例なら、全てが偶然だとしても別に不思議はありません。

4.打者のBABIPとWARの相関

相関があるとしても当然です。
打者においては安打は自身の手柄ですのでそのまま評価され、単純に、安打を打てばBABIPもWARも上昇します。
もちろんWARにはその他の要素も多く含まれますが、部分的に(本質的には)同じもの同士を比較しているのですから相関が出ることには不思議はありません。
何故打者と投手でBABIPの扱いが違うのかについては当コメント欄の上のやりとりをご覧下さい。

5.投手の守備力で牽制アウトとはZR系ではどのように評価されるか

これはよく知りません。投手のZR系守備評価自体あまり考えることがないもので。
牽制死は、英語ではPickoffですね。

回答ありがとうございます

<そもそも守備位置ごとの打撃指標の差をもって守備位置補正とする

これについてですが 守備位置による補正値 例えばキャッチャーであれば +12.5でしたっけ?この数値の中に各守備位置における 負担度難易度だけでなく 攻撃力の数値をも補正する意味もこめていると考えていいでしょうか

>沖さん

詳しい解釈の仕方は複数の道に開かれていると思います。
私がここで述べているのは単に、守備位置に関する補正値を算出する際、守備指標を用いた算出が行なえない場合に代理的な方法として打撃指標を用いた算出をもって推定値とする場合があるという事実に過ぎません。
守備指標を基に補正値を算出した場合そこに攻撃の問題は絡んでこないと思いますが、打撃指標によって算出した場合は微妙ですね。
まぁ、各所でのセイバーメトリシャンの口ぶりからすると、攻撃力に関する補正ということを積極的に考えている例は少ないと思います。
WARでは原則、打撃はそもそも全野手で問題なく比較できるものであり、守備に関してのみ補正が必要、と考えているのではないでしょうか。

拙稿ですがよろしければご参考までに。
http://bbalone.blog119.fc2.com/blog-entry-485.html

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/517-f48e0197

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。