Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

MLBのデータから守備指標を軽く検証する その2

UZRとNPBデータから算出できる守備指標との比較。
とりあえず外野手評価と同じような感じでRFにBIP補正&GO/AO補正を加えた指標(RRFととても結果が近いことを確認済み。ただし今回は投手の左右補正なし)を作り比較してみます。
内野手特有の問題として刺殺と補殺に様々な種類のプレーが絡み合っていることがあり、その影響を考え参考までに刺殺・補殺それぞれの数字も掲載しました。
得点化の係数はまだ暫定バージョンといったところです。
あと書き忘れていましたが前回から対象としているのは500イニング以上守備に就いた選手です。

UZR→信頼度が高いとされるPBPシステム。併殺付与能力の評価などを含む。
PO+,A+→平均的な守備者が守るのに比べていくつ多く刺殺または補殺を稼いだか
Plays→PO+とA+を足し合わせたもの。Plus Plays。
Runs→PO+とA+を得点に変換したもの。
Error/140→1260イニング換算でのRunsとUZRとの差
PEARSON→UZRとの相関係数
STDEV→標準偏差


NamePosInnUZR PO+A+PlaysRuns Error/140
Mark Ellis2B1011.2 17 12 15 27 12 -7
Dustin Pedroia2B1376.1 10 8 39 47 24 12
Asdrubal Cabrera2B776.2 6 19 9 28 10 7
Mark Grudzielanek2B710.2 3 -16 31 15 13 19
Akinori Iwamura2B1337.0 2 23 8 30 10 8
Placido Polanco2B1201.1 1 55 -25 30 1 0
Howie Kendrick2B776.0 1 -17 31 14 13 20
Jamey Carroll2B580.1 -1 -32 -11 -43 -15 -31
Alexi Casilla2B833.2 -1 4 -38 -34 -20 -30
Brian Roberts2B1320.0 -4 -17 -15 -32 -13 -9
Jose Lopez2B1229.1 -4 -26 43 17 17 21
Joe Inglett2B541.1 -4 1 -6 -5 -3 3
Ian Kinsler2B1064.0 -5 38 11 49 17 25
Alexei Ramirez2B1017.1 -7 -5 -34 -40 -21 -17
Robinson Cano2B1376.2 -7 -17 7 -10 0 6
PEARSON---- 1.000 0.261 0.355 0.494 0.472 0.029
STDEV---- 7 24 26 31 14 18
Evan Longoria3B1045.2 15 12 26 38 25 12
Adrian Beltre3B1208.1 13 -2 -8 -10 -7 -21
Mike Lowell3B935.2 10 7 16 23 15 7
Jack Hannahan3B983.2 8 -6 8 2 2 -8
Chone Figgins3B914.1 7 11 -17 -6 -5 -17
Joe Crede3B834.2 6 -15 8 -7 -4 -16
Scott Rolen3B1006.2 6 -8 -10 -18 -12 -22
Andy Marte3B581.1 2 -7 18 12 8 14
Alex Rodriguez3B1126.1 -1 -15 8 -7 -4 -4
Brian Buscher3B519.1 -3 -6 -6 -13 -8 -13
Carlos Guillen3B749.2 -4 8 28 36 24 46
Alex Gordon3B1180.0 -4 21 -22 -1 -1 3
Melvin Mora3B1059.2 -5 -4 7 3 2 8
Casey Blake3B635.0 -7 -15 -8 -24 -15 -17
Ramon Vazquez3B533.0 -8 -16 -10 -26 -17 -22
PEARSON---- 1.000 0.303 0.255 0.380 0.377 -0.094
STDEV---- 7 12 15 20 13 19
Orlando CabreraSS1389.2 16 -11 1 -10 -3 -18
Mike AvilesSS747.2 16 19 11 31 14 -2
Nick PuntoSS530.2 7 10 14 24 13 14
Erick AybarSS784.2 6 8 29 37 22 26
Tony PenaSS592.0 5 -22 0 -22 -8 -26
Bobby CrosbySS1263.0 2 -3 1 -3 -1 -3
Jason BartlettSS1097.0 2 40 4 44 17 18
Derek JeterSS1258.2 0 13 -40 -27 -22 -21
Edgar RenteriaSS1173.1 -1 -2 -7 -10 -6 -5
Jhonny PeraltaSS1271.1 -1 -11 1 -10 -3 -2
Julio LugoSS671.1 -1 -10 -29 -39 -23 -40
Michael YoungSS1289.0 -3 -42 27 -15 3 5
Yuniesky BetancourtSS1325.1 -13 2 -37 -34 -23 -10
PEARSON---- 1.000 0.177 0.495 0.519 0.553 0.106
STDEV---- 8 20 22 28 15 18


内野手も外野手と同様140試合換算で20点程度のエラーは標準的という結果になってしまいました(得点化して相関が下がってるとこはちゃんと考えないとダメですね)。
Error/140を±5点以内に収めた割合は18.6%で外野手よりやや厳しい。
一応相関はありますが、基本的に守備の利得を算出するのにRFはあまり的確ではないことになりそうです。
まぁ前回最後に断った通りUZRが「正解」であるとは限りませんしどの項目を守備の能力として認めるかなど意見が分かれても不思議はありませんので守備の見方にいくつかのアプローチが同時に成立してもいいのかもしれませんが、シンプルに考えれば真の守備得点がひとつ存在するとしてUZRとRFどちらかは間違った指標であると言わざるを得ないでしょう。
というか内野手のUZRはフライやライナーを含めないと聞いているんですが刺殺を含めると相関が上がるんですね。
余談ですが、岩村はコンバートされたばかりでメジャーリーグで平均的な二塁守備をしてみせたというなかなか立派な結果を収めていますね。セイバー系サイトで守備位置補正の考察の材料になったり攻守ともにアベレージなプレイヤーとして例で取り上げられたりしていました。純粋に守備範囲ではほんのわずか平均を下回るものの併殺完成能力でフォローしたようです。

ちょっとポジティブな話。
得点化でのエラーはいかんともしがたいものがありますけど、傾向を示すぐらいなら使えるだろうという結果が出ているのも事実です。
サンプルを積めばある程度の相関はありますし、選手をプラスかマイナスかの二極で評価する場合内野手で72%の一致、外野手を含めた今回の全85サンプルで68%一致しています。まぁ適当にやっても50%は一致するだろうテストではありますが、ランダムなシステムがこの数字を出す確率は低いはずで。
例えばRRFでハイスコアをマークしている選手がいたらその選手はUZR等詳細なデータで見ても少なくともプラスの選手である確率は高いということではないでしょうか。
その程度が「ポジティブな話」なのか段々自分でもよくわからなくなってきましたが。

それと前回からの外野手評価の話で、当方が行っているようなRFに対する補正がそれなりに機能していることを示す資料になるかなという数字。
THTのRZRを利用して算出したチームの外野手全体のプラスプレイとBIP補正・GO/AO補正をした数字(BCS)、GO/AO補正なしのBIPベースの数字(BPB)、イニングベースの数字(RF)を比較した表です。


TeamRZRBCSBPB RF
Toronto Blue Jays-24 -10 -76 -129
Tampa Bay Rays36 6 98 50
Los Angeles Angels-34 -40 -47 -64
Boston Red Sox-12 -4 -11 -59
Oakland Athletics54 81 105 79
Chicago White Sox-24 -35 -126 -140
Minnesota Twins5 62 65 99
New York Yankees-34 -61 -40 -55
Cleveland Indians40 15 -15 12
Kansas City Royals-22 -8 41 38
Seattle Mariners-10 -23 -36 -8
Detroit Tigers-5 -33 -1 26
Baltimore Orioles5 21 28 73
Texas Rangers26 27 15 77
PEARSON1.000 0.777 0.697 0.677

単純なイニングベースでは奪三振が多かったりゴロ傾向が強く外野に打球が飛んでこないチームの外野陣を極端に低く評価してしまったりしていて、BIPをベースにしてもそれだけでは極端な数字を出してしまいがち。GO/AO補正をすると数字は比較的RZRと近い範囲に落ち着きながら守備力の違いも反映しています。
PBPデータを得ることほど劇的な効果でないにしろ、これまでセイバーメトリシャンが行ってきた努力は有意義なものとして認められるべきですし、視点の置き方によってはNPB公式記録からでも結構「使える数字」は出せるということです。

あと今回改めて守備の数字を色々眺めて思ったんですが、ファウルフライの数は馬鹿にならないですね。ファウルフライは捕球したとしてヒットを防ぐわけではなく普通のプラスプレイと異なる加重が必要と思われるわけですが、Plays madeベースの守備評価では違いがわかりません。個々の打球のバリューということを考えるとUZRの説得力がより強く感じられる気がします。



数字出すので結構疲れたのでこの辺でまとめ。
まぁ、RFというと主観的な評価と極端に食い違う例を取り上げたりして「使える・使えない」の話になったりしがちなようですが、「どのくらい使えるか」の程度をちゃんと探るのが大事なのは他の数字と同じ話だと思います。
傾向を見る上ではそれなりの参考になって、数字が全くない状態よりは遥かにマシなのではないでしょうか。
今回のはサンプル数も少なく検証と言うには物凄く適当だということをご注意下さい。また、UZRは新鋭の守備指標の例として登場願っただけであり、相関を探ったのもあくまでひとつの資料。NPBの守備指標の改良がUZRと同じ結果を出すことを目指して行われているわけではありません。
それにしても数字をとってみると色々思うことがあったんですが色々あるだけに上手く文章にできません。今後のサイト運営なんかに活かしていければなと思います。



コメント

 結論としては、RF系の数値は
上手いか下手か以上のことは、どの程度上手いのか
複数の選手のどちらが上手いのかは教えてくれない
かもしれない、ということですか?

 多分、打球速度や落下点、守備位置の類のデータは
仮にNPBでも計測するようになったとしても
ブラックボックス入りするのは確実なので、
私のような素人にとっては、現在の
「経験者以外の素人は口を出すな!」と
マシではあっても立場的には大して変わらない
という悲しい状況だということを認めないと
いけないわけですね・・・。

でもこの検証は大変良心的な行為だと思います。
お疲れ様でした。

RZRの数値は常にRFより幅が狭くなっているんですね。要するに最も優秀な者とそうでない者に差がつかない。
果たしてこの程度の差で優先して考えるべき項目となり得るのか、RFの得点化の数値は過大ではないのかというDIMEさんの疑問をもう一度考えなければならないところかもしれませんね。
ファウルフライのカベもまだまだ克服すべき対象になってきそうです。
ジェームスさんの発案のRFの方が本人の意見(守備の試合への影響力は低い)とは遠く
むしろ本人の発案ではないZRZの方が本人の意見を強く支持する結果になっているのは面白いです。

ところでFielding Bible におけるジェームス氏の「プラスマイナスシステムとの99%の一致」と言う話はちょっとどうなのかな、という気も少し。

>りんちゅーさん

だいたい仰るようなところですかねぇ。
この程度のサンプル数及びこの程度の検証方法で一般化できるような結論を出すのは怖いのが正直なところですが
今回の数字はエラーが誤魔化されずそれなりにはっきり出るような単位で表したものであり
逆に言うとこれ以上のエラーは起こりにくいことを示しています。
例えば今回の数字でBCSの得点評価が±20を超えたうちUZRのプラスマイナスが同じ傾向を示したのは88%(14/16)。
レンジ評価が太鼓判を押した選手は傾向としてはその方向である確率がかなり高いと。
「微妙な違いを見るほどにはあてにならないけれど、極端な数字が出ている場合参考に値する」でしょうか。なんか一般的に言われてることと変わらない気がしますが。
金子や鳥谷が少なくとも去年に関して優れた部類の遊撃守備をしただろうことを信じるための根拠ぐらいにはなるんじゃないかと。

>ブラックボックス入りするのは確実なので
守備指標について高度な議論をしている向こうのセイバーメトリシャンもUZRの詳細に関してはきちんと把握しているわけではないようです。
ただUZRは基本となる考え方がきちんと説明されているから受け入れられているようで、それでいいんだろうと思いますし、いつの日か日本でもそういうスタッツが出てくるなら基本線の説明だけは丁寧に行って欲しいものですね。

>でもこの検証は大変良心的な行為だと思います。
大したことはできませんでしたが、数字に誠実であろうとした結果のプロセスであることが理解して頂けて嬉しい限りです。

>道作さん

バイアスを排除して実力だけ浮き上がらせてみたら、レンジで騒いでたほど差はなかったじゃんてな話でしょうか。
守備力を重視すべきかどうかは非常に微妙なところな気がしますね。チーム全体のプラスマイナスを見ても……うーん。
道作さんがこの前掲示板に書かれていた「0.71ってのは投手の責を一切ないものとした場合」っていうのも重なりますし
ゾーンの数字だって主観やluckを含まないとは言えませんし。
ただまぁ個人的にはその問題は得点化の係数にかかってほしくはないですが。
ファウルフライ等の問題は個々の打球に得点期待値を適用しないと解決しない気がするので、プラスマイナスシステムがPlays made評価なのが残念です。プレイ数を最大化することと得点期待値を最少化することが食い違う場面も無視できないほどには存在しそうで。
細かく結果を出していれば適切にRunコンバートするのは簡単なのかもしれませんが。

RRFはBaseball ProspectusのnonPBPシステム(算出法不明)にとても似ているという話とBaseball ProspectusのシステムはUZRとかなり相関しているという話を聞いていたので今回の結果はちょっと残念でした。サンプルも少なければきちんとRRFを出したわけでもないのでお門違いかもしれないんですけど。

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/306-0034c2f5

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。