Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

MLBのデータから守備指標を軽く検証する その1

先日公開した外野手守備評価について、MLBのデータを利用して最新システムとの関係を検証しました。
正直な話わざわざ指標を計算した者にとって厳しい結果も出たりなんですが誤魔化しておいてもよくないし最近セイバーメトリクスが浸透してきて数字が一人歩きする例もなくはなさそうなので、水をぶっかけておく意味でも。

MLBで一般に結果と考え方が公開されており信頼度の高いものとして、UZRを参考にします。
UZRはplay-by-playデータを使用して守備を得点換算したもの。大まかな考え方を見た限りではプラスマイナスシステムと似ているように感じますし、RZRなどとも相関しているようです。
UZRの結果が得られている2008年アメリカンリーグの外野手をNPBに適用可能な手法(要は前回出したやつ)で評価し、UZRと比較。これで結果が似ていれば信頼度の高い守備指標の代用として機能すると判断していいでしょう。
ただしアームレイティングは基本的にデータがなければあきらめるべきものだと思うので除外しています。

UZR→信頼度が高いとされるPBPシステム(アーム評価を除外)
BCS→当方の外野手評価システム
RF→単純なイニングあたりの刺殺の得点換算
Error/140→1260イニング換算でのUZRとの差


NamePosInnUZR BCSError/140RF Error/140
Carl CrawfordLF920.2 20 16 -6 23 3
Johnny DamonLF659.1 8 7 -2 8 -1
Garret AndersonLF689.1 7 -4 -20 -7 -25
Luke ScottLF840.1 5 4 -2 12 10
Brandon BoggsLF579.0 3 -3 -13 2 -2
Ben FranciscoLF643.0 0 7 13 6 12
Manny RamirezLF537.2 -2 -12 -22 -17 -34
Adam LindLF590.2 -4 -3 3 -15 -23
Carlos QuentinLF1147.0 -7 -1 6 -22 -17
Jack CustLF585.2 -8 0 18 0 17
Raul IbanezLF1340.0 -13 1 13 5 16
Delmon YoungLF1324.0 -18 -18 0 -9 8
Carlos GomezCF1271.2 16 40 24 51 34
Grady SizemoreCF1338.0 11 -10 -20 -11 -21
Adam JonesCF1102.0 7 -5 -14 9 2
Alex RiosCF522.2 4 16 27 1 -7
Jacoby EllsburyCF546.2 4 15 26 8 10
B.J. UptonCF1248.2 3 -4 -8 8 4
Carlos GonzalezCF528.2 3 17 33 17 32
Joey GathrightCF720.0 3 -21 -41 -13 -28
Ichiro SuzukiCF601.2 2 13 23 15 27
Melky CabreraCF973.2 0 -14 -19 -13 -17
David DeJesusCF507.0 -3 -4 -3 1 10
Nick SwisherCF535.1 -3 -4 -3 -17 -32
Coco CrispCF886.0 -6 -12 -9 -23 -25
Torii HunterCF1193.1 -9 4 14 -2 7
Josh HamiltonCF912.0 -10 -12 -3 -1 12
Curtis GrandersonCF1188.0 -11 -3 8 13 25
Vernon WellsCF889.0 -13 -14 -2 -38 -36
Franklin GutierrezRF763.2 18 40 37 40 36
Alex RiosRF820.0 13 1 -19 -17 -46
Gabe GrossRF761.2 10 0 -16 6 -7
J.D. DrewRF886.0 9 -9 -26 -18 -39
Denard SpanRF686.2 7 23 31 28 39
Nick MarkakisRF1367.0 3 -5 -7 9 5
Ichiro SuzukiRF788.1 1 -9 -15 -6 -11
Mark TeahenRF756.1 -3 2 8 8 18
Michael CuddyerRF501.2 -5 3 20 6 28
Jose GuillenRF539.1 -6 -8 -4 -3 6
Magglio OrdonezRF1144.0 -6 -50 -48 -38 -35
Vladimir GuerreroRF839.0 -7 -9 -2 -12 -7
Jermaine DyeRF1312.2 -14 -8 6 -32 -17
Bobby AbreuRF1310.0 -25 -30 -4 -28 -3
STDEV---- 10 16 19 19 23


まぁ、かなりキツイような気がします。
UZRで算出される個々の偏差など誤差に埋もれてしまうではないかという感じが。
RFと比べると補正をすることの効果は認められるべきと思いますが、そう劇的な違いにも思えません。
+18の選手を+40とか評価しちゃうのはある意味可愛いもんであるとしても+11をしれっと-10とかしちゃうのが危ない。
UZRに対して1260イニング換算の誤差を±5点以内に収めた割合はBCSが25.6%、RFが16.3%。影響が0.5勝に満たず「あまり違いはない」と見られるのは1/4程度ということでしょうか。相関係数は0.6弱。
イニング数の多い選手ほどズレ具合が小さくなるかというとそういう雰囲気でもなく、やはり(偶然でない)バイアスの排除ができていないのでしょう。
誤差と相関がある要素を調べられれば指標の改善に役立てられるかもしれませんが、現状そこまでできていません。
20点程度の誤差は織り込めとか言われてもちょっと話にならないですよねぇ。
あくまでMLBのデータでの話だしUZRが“正しい”保証はないという前提はありますが。

次回は内野手をやろうかと。MLBのデータを扱い慣れてないので少数のサンプル集めるだけでいっぱいいっぱいです。



コメント

これは・・・。
でも誠実な対応です。
守備を測る各スタッツってもう少し共通するかも、
と思ってたんですが。
ゴールドグラブのジーターが
どの指標でもへぼ、という話は
知られてますし、松井稼頭央が
逆に見た目では悪評にも関わらず、
RF系でもプラスマイナスシステム
でもかなりいい数字、というのも
読んでるので。
 
RF系は出来高、ZR系は能力を
測るもんだから一致しないのは
当然、と開き直るべきなんでしょうか?
能力はさほどでなくてもたまたま
自分の守備範囲に飛んできた打球が
多ければRF系は数字が上がるから、
乖離はそのせい、という理解で
いいんでしょうか?

ところでBCSって
Baseball Concrete Systemの略ですか?


>りんちゅーさん

出来高と能力というのは言葉の使い方次第になるところありますけど、まぁ現段階でそのような言い方をしてしまうと言い訳くさくなってしまうでしょうね。
本人の資質によらない要素を多分に含めば打点などと同じで評価に使えないスタッツであることを認めなきゃならないですし。
たまたま自分の守備範囲に飛んできた打球が多ければ~というのはその通りだと思います。
特に外野手はフライの捕球が「刺殺」で明らかですので、相違はほぼ分母(責任機会数)のみということになりますから。得点加重でも差はつきますがゾーンの問題ほど重大ではないでしょう。
ところで次回の記事に詳しく書こうと思いますが「良い or 悪い」の傾向を示すぐらいならRFも無視はできない程度の参考にはなりそうです。

>Baseball Concrete Systemの略ですか?
ご推察の通りです。
なんでもいいから識別可能な記号をと思って置いたもののなんかダサイと思い何の略か書いてなかったんですがバレちゃいましたねw

これは前から気になっていたことではあるんですよね。
結局は外野の中間にヘロヘロっと上がる、2人のどちらが取ってもいいような打球をどちらが取るのかカタい決めがある場合にレンジ系とゾーン系で大きな相違が現われることが影響していると思います。
全部がそうではないでしょうがね。
例えばボストンの3人はプラスマイナスが逆方向に相殺されるような結果になっている。
間に上がったどちらも取れるような打球を取るのはクリスプかエルズバリーに予め決めてあったのではないでしょうか。
これですと、センターが取ってしまった打球はレフトのゾーンの分母にはならず、外野全体として見た場合のレンジの分母には入る。

どっちが取ってもいいのに必ず取る負担を強いられているのは上手いからで、これは実力という考え方もあり得ますし。
また、ゾーンで見たらこれで実は助かってる右翼手か左翼手はけっこう居るのではありませんかね。

いずれにせよどちらで計測するにしても先に確かにすべきなのは外野全体の守備力なのかもしれませんね。

>道作さん

ゾーン内のレートが同じでもゾーン自体が縮小すればレンジは下がる、というところでしょうか。
レンジ評価とゾーン評価の差、左翼・中堅・右翼間のBIZ&OOZのシェアなどを見るとなかなか面白いです。
ただ個別のケースについてはなかなかなんとも言えなくて、あまりきれいには出てくれないのかもしれませんが。

あぁ、ただ改めてUZRの説明を見ると被安打など責任をシェアするような考え方が用いられているようで、アウトに関しても文字通りのゾーンの縮小というのは起こらないのかもしれません。
システムの改定もあったりしますし細かいところを知るのは難しいですね。

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/305-35ed1cd5

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ