Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

1番青木2番中島って豪華だなぁ

前菜からウニ・イクラというか。1・2番の役割が「前菜」で済まされるわけはないですけど。
それにしてもどういう試合であれやはり杉内みたいに抑えるのを見るのは気持ちがいいですね。







How to measure a player’s value

英語の記事(THT)ですけど、力作というかよくできている感じがしますね。あんまりちゃんとは読めてないんですが。
FanGraphsでもちょっと前までWin Valueの話をしてましたし、ネット系のメディアで選手の評価を総合評価に落とし込むのが一般的になってきたという感じでしょうか。
今回のTHTの記事に至っては何かプラモデルみたいだなと思いました。パッケージになっていて適宜アレンジ可能、というか……

現状、打撃評価の守備位置補正という考え方はあまり好んでいなくて、守備位置別の難易度・貢献の高さみたいなものを導入したいんですよねぇ。ただ方法もあまり思いつかないし思いつくとしても実行に移すのが難しそう。
ついでにAbove Replacementってあんまり馴染めないんですが一般的ですね。


スポンサーサイト

四方山話更新

サイトに守備指標についての話追加。
いつも思うんですが長く書こうとするわりに文章力がない。
シーズン開幕前にやっちゃいたいと思っていたネタみたいのがまだいくつかありますが、どうなるか……

WBCのメンバーは良いのか悪いのかよくわからんですね。マックでもらえるアレはちょっと欲しいかも。ほっといてもマック好きだし。


データを増やしたいところ

2005年以降の守備指標整理中。やっぱり色々試すには、面倒でも最初に関係するデータをまとめたデータベースを作ってしまったほうがラクですね。

得点化の係数はとりあえず守備位置ごと、刺殺・補殺ごとに出す必要があるなと感じていて今のところは

守備位置 刺殺 補殺
二塁手  0.25 0.63
三塁手  0.43 0.67
遊撃手  0.36 0.69

となっていますけど、どうもちょっとおかしな感じが。
一年分だけでも詳しいデータがあればなぁ。



ところで野球SNSのNaranjaさんという方が公開されている推定守備イニングのデータは、それと表示してサイトなんかで使わせて頂いても差し障りないんですかね。とっても有用なデータで、利用可能なら2005年や2006年の個別RRFも算出できますが。やはりIDを作って伺わないと失礼かな。
こんな風にデータ集計手法を進化させられるって尊敬します。


MLBのデータから守備指標を軽く検証する その2

UZRとNPBデータから算出できる守備指標との比較。
とりあえず外野手評価と同じような感じでRFにBIP補正&GO/AO補正を加えた指標(RRFととても結果が近いことを確認済み。ただし今回は投手の左右補正なし)を作り比較してみます。
内野手特有の問題として刺殺と補殺に様々な種類のプレーが絡み合っていることがあり、その影響を考え参考までに刺殺・補殺それぞれの数字も掲載しました。
得点化の係数はまだ暫定バージョンといったところです。
あと書き忘れていましたが前回から対象としているのは500イニング以上守備に就いた選手です。

UZR→信頼度が高いとされるPBPシステム。併殺付与能力の評価などを含む。
PO+,A+→平均的な守備者が守るのに比べていくつ多く刺殺または補殺を稼いだか
Plays→PO+とA+を足し合わせたもの。Plus Plays。
Runs→PO+とA+を得点に変換したもの。
Error/140→1260イニング換算でのRunsとUZRとの差
PEARSON→UZRとの相関係数
STDEV→標準偏差


NamePosInnUZR PO+A+PlaysRuns Error/140
Mark Ellis2B1011.2 17 12 15 27 12 -7
Dustin Pedroia2B1376.1 10 8 39 47 24 12
Asdrubal Cabrera2B776.2 6 19 9 28 10 7
Mark Grudzielanek2B710.2 3 -16 31 15 13 19
Akinori Iwamura2B1337.0 2 23 8 30 10 8
Placido Polanco2B1201.1 1 55 -25 30 1 0
Howie Kendrick2B776.0 1 -17 31 14 13 20
Jamey Carroll2B580.1 -1 -32 -11 -43 -15 -31
Alexi Casilla2B833.2 -1 4 -38 -34 -20 -30
Brian Roberts2B1320.0 -4 -17 -15 -32 -13 -9
Jose Lopez2B1229.1 -4 -26 43 17 17 21
Joe Inglett2B541.1 -4 1 -6 -5 -3 3
Ian Kinsler2B1064.0 -5 38 11 49 17 25
Alexei Ramirez2B1017.1 -7 -5 -34 -40 -21 -17
Robinson Cano2B1376.2 -7 -17 7 -10 0 6
PEARSON---- 1.000 0.261 0.355 0.494 0.472 0.029
STDEV---- 7 24 26 31 14 18
Evan Longoria3B1045.2 15 12 26 38 25 12
Adrian Beltre3B1208.1 13 -2 -8 -10 -7 -21
Mike Lowell3B935.2 10 7 16 23 15 7
Jack Hannahan3B983.2 8 -6 8 2 2 -8
Chone Figgins3B914.1 7 11 -17 -6 -5 -17
Joe Crede3B834.2 6 -15 8 -7 -4 -16
Scott Rolen3B1006.2 6 -8 -10 -18 -12 -22
Andy Marte3B581.1 2 -7 18 12 8 14
Alex Rodriguez3B1126.1 -1 -15 8 -7 -4 -4
Brian Buscher3B519.1 -3 -6 -6 -13 -8 -13
Carlos Guillen3B749.2 -4 8 28 36 24 46
Alex Gordon3B1180.0 -4 21 -22 -1 -1 3
Melvin Mora3B1059.2 -5 -4 7 3 2 8
Casey Blake3B635.0 -7 -15 -8 -24 -15 -17
Ramon Vazquez3B533.0 -8 -16 -10 -26 -17 -22
PEARSON---- 1.000 0.303 0.255 0.380 0.377 -0.094
STDEV---- 7 12 15 20 13 19
Orlando CabreraSS1389.2 16 -11 1 -10 -3 -18
Mike AvilesSS747.2 16 19 11 31 14 -2
Nick PuntoSS530.2 7 10 14 24 13 14
Erick AybarSS784.2 6 8 29 37 22 26
Tony PenaSS592.0 5 -22 0 -22 -8 -26
Bobby CrosbySS1263.0 2 -3 1 -3 -1 -3
Jason BartlettSS1097.0 2 40 4 44 17 18
Derek JeterSS1258.2 0 13 -40 -27 -22 -21
Edgar RenteriaSS1173.1 -1 -2 -7 -10 -6 -5
Jhonny PeraltaSS1271.1 -1 -11 1 -10 -3 -2
Julio LugoSS671.1 -1 -10 -29 -39 -23 -40
Michael YoungSS1289.0 -3 -42 27 -15 3 5
Yuniesky BetancourtSS1325.1 -13 2 -37 -34 -23 -10
PEARSON---- 1.000 0.177 0.495 0.519 0.553 0.106
STDEV---- 8 20 22 28 15 18


内野手も外野手と同様140試合換算で20点程度のエラーは標準的という結果になってしまいました(得点化して相関が下がってるとこはちゃんと考えないとダメですね)。
Error/140を±5点以内に収めた割合は18.6%で外野手よりやや厳しい。
一応相関はありますが、基本的に守備の利得を算出するのにRFはあまり的確ではないことになりそうです。
まぁ前回最後に断った通りUZRが「正解」であるとは限りませんしどの項目を守備の能力として認めるかなど意見が分かれても不思議はありませんので守備の見方にいくつかのアプローチが同時に成立してもいいのかもしれませんが、シンプルに考えれば真の守備得点がひとつ存在するとしてUZRとRFどちらかは間違った指標であると言わざるを得ないでしょう。
というか内野手のUZRはフライやライナーを含めないと聞いているんですが刺殺を含めると相関が上がるんですね。
余談ですが、岩村はコンバートされたばかりでメジャーリーグで平均的な二塁守備をしてみせたというなかなか立派な結果を収めていますね。セイバー系サイトで守備位置補正の考察の材料になったり攻守ともにアベレージなプレイヤーとして例で取り上げられたりしていました。純粋に守備範囲ではほんのわずか平均を下回るものの併殺完成能力でフォローしたようです。

ちょっとポジティブな話。
得点化でのエラーはいかんともしがたいものがありますけど、傾向を示すぐらいなら使えるだろうという結果が出ているのも事実です。
サンプルを積めばある程度の相関はありますし、選手をプラスかマイナスかの二極で評価する場合内野手で72%の一致、外野手を含めた今回の全85サンプルで68%一致しています。まぁ適当にやっても50%は一致するだろうテストではありますが、ランダムなシステムがこの数字を出す確率は低いはずで。
例えばRRFでハイスコアをマークしている選手がいたらその選手はUZR等詳細なデータで見ても少なくともプラスの選手である確率は高いということではないでしょうか。
その程度が「ポジティブな話」なのか段々自分でもよくわからなくなってきましたが。

それと前回からの外野手評価の話で、当方が行っているようなRFに対する補正がそれなりに機能していることを示す資料になるかなという数字。
THTのRZRを利用して算出したチームの外野手全体のプラスプレイとBIP補正・GO/AO補正をした数字(BCS)、GO/AO補正なしのBIPベースの数字(BPB)、イニングベースの数字(RF)を比較した表です。


TeamRZRBCSBPB RF
Toronto Blue Jays-24 -10 -76 -129
Tampa Bay Rays36 6 98 50
Los Angeles Angels-34 -40 -47 -64
Boston Red Sox-12 -4 -11 -59
Oakland Athletics54 81 105 79
Chicago White Sox-24 -35 -126 -140
Minnesota Twins5 62 65 99
New York Yankees-34 -61 -40 -55
Cleveland Indians40 15 -15 12
Kansas City Royals-22 -8 41 38
Seattle Mariners-10 -23 -36 -8
Detroit Tigers-5 -33 -1 26
Baltimore Orioles5 21 28 73
Texas Rangers26 27 15 77
PEARSON1.000 0.777 0.697 0.677

単純なイニングベースでは奪三振が多かったりゴロ傾向が強く外野に打球が飛んでこないチームの外野陣を極端に低く評価してしまったりしていて、BIPをベースにしてもそれだけでは極端な数字を出してしまいがち。GO/AO補正をすると数字は比較的RZRと近い範囲に落ち着きながら守備力の違いも反映しています。
PBPデータを得ることほど劇的な効果でないにしろ、これまでセイバーメトリシャンが行ってきた努力は有意義なものとして認められるべきですし、視点の置き方によってはNPB公式記録からでも結構「使える数字」は出せるということです。

あと今回改めて守備の数字を色々眺めて思ったんですが、ファウルフライの数は馬鹿にならないですね。ファウルフライは捕球したとしてヒットを防ぐわけではなく普通のプラスプレイと異なる加重が必要と思われるわけですが、Plays madeベースの守備評価では違いがわかりません。個々の打球のバリューということを考えるとUZRの説得力がより強く感じられる気がします。



数字出すので結構疲れたのでこの辺でまとめ。
まぁ、RFというと主観的な評価と極端に食い違う例を取り上げたりして「使える・使えない」の話になったりしがちなようですが、「どのくらい使えるか」の程度をちゃんと探るのが大事なのは他の数字と同じ話だと思います。
傾向を見る上ではそれなりの参考になって、数字が全くない状態よりは遥かにマシなのではないでしょうか。
今回のはサンプル数も少なく検証と言うには物凄く適当だということをご注意下さい。また、UZRは新鋭の守備指標の例として登場願っただけであり、相関を探ったのもあくまでひとつの資料。NPBの守備指標の改良がUZRと同じ結果を出すことを目指して行われているわけではありません。
それにしても数字をとってみると色々思うことがあったんですが色々あるだけに上手く文章にできません。今後のサイト運営なんかに活かしていければなと思います。



MLBのデータから守備指標を軽く検証する その1

先日公開した外野手守備評価について、MLBのデータを利用して最新システムとの関係を検証しました。
正直な話わざわざ指標を計算した者にとって厳しい結果も出たりなんですが誤魔化しておいてもよくないし最近セイバーメトリクスが浸透してきて数字が一人歩きする例もなくはなさそうなので、水をぶっかけておく意味でも。

MLBで一般に結果と考え方が公開されており信頼度の高いものとして、UZRを参考にします。
UZRはplay-by-playデータを使用して守備を得点換算したもの。大まかな考え方を見た限りではプラスマイナスシステムと似ているように感じますし、RZRなどとも相関しているようです。
UZRの結果が得られている2008年アメリカンリーグの外野手をNPBに適用可能な手法(要は前回出したやつ)で評価し、UZRと比較。これで結果が似ていれば信頼度の高い守備指標の代用として機能すると判断していいでしょう。
ただしアームレイティングは基本的にデータがなければあきらめるべきものだと思うので除外しています。

UZR→信頼度が高いとされるPBPシステム(アーム評価を除外)
BCS→当方の外野手評価システム
RF→単純なイニングあたりの刺殺の得点換算
Error/140→1260イニング換算でのUZRとの差


NamePosInnUZR BCSError/140RF Error/140
Carl CrawfordLF920.2 20 16 -6 23 3
Johnny DamonLF659.1 8 7 -2 8 -1
Garret AndersonLF689.1 7 -4 -20 -7 -25
Luke ScottLF840.1 5 4 -2 12 10
Brandon BoggsLF579.0 3 -3 -13 2 -2
Ben FranciscoLF643.0 0 7 13 6 12
Manny RamirezLF537.2 -2 -12 -22 -17 -34
Adam LindLF590.2 -4 -3 3 -15 -23
Carlos QuentinLF1147.0 -7 -1 6 -22 -17
Jack CustLF585.2 -8 0 18 0 17
Raul IbanezLF1340.0 -13 1 13 5 16
Delmon YoungLF1324.0 -18 -18 0 -9 8
Carlos GomezCF1271.2 16 40 24 51 34
Grady SizemoreCF1338.0 11 -10 -20 -11 -21
Adam JonesCF1102.0 7 -5 -14 9 2
Alex RiosCF522.2 4 16 27 1 -7
Jacoby EllsburyCF546.2 4 15 26 8 10
B.J. UptonCF1248.2 3 -4 -8 8 4
Carlos GonzalezCF528.2 3 17 33 17 32
Joey GathrightCF720.0 3 -21 -41 -13 -28
Ichiro SuzukiCF601.2 2 13 23 15 27
Melky CabreraCF973.2 0 -14 -19 -13 -17
David DeJesusCF507.0 -3 -4 -3 1 10
Nick SwisherCF535.1 -3 -4 -3 -17 -32
Coco CrispCF886.0 -6 -12 -9 -23 -25
Torii HunterCF1193.1 -9 4 14 -2 7
Josh HamiltonCF912.0 -10 -12 -3 -1 12
Curtis GrandersonCF1188.0 -11 -3 8 13 25
Vernon WellsCF889.0 -13 -14 -2 -38 -36
Franklin GutierrezRF763.2 18 40 37 40 36
Alex RiosRF820.0 13 1 -19 -17 -46
Gabe GrossRF761.2 10 0 -16 6 -7
J.D. DrewRF886.0 9 -9 -26 -18 -39
Denard SpanRF686.2 7 23 31 28 39
Nick MarkakisRF1367.0 3 -5 -7 9 5
Ichiro SuzukiRF788.1 1 -9 -15 -6 -11
Mark TeahenRF756.1 -3 2 8 8 18
Michael CuddyerRF501.2 -5 3 20 6 28
Jose GuillenRF539.1 -6 -8 -4 -3 6
Magglio OrdonezRF1144.0 -6 -50 -48 -38 -35
Vladimir GuerreroRF839.0 -7 -9 -2 -12 -7
Jermaine DyeRF1312.2 -14 -8 6 -32 -17
Bobby AbreuRF1310.0 -25 -30 -4 -28 -3
STDEV---- 10 16 19 19 23


まぁ、かなりキツイような気がします。
UZRで算出される個々の偏差など誤差に埋もれてしまうではないかという感じが。
RFと比べると補正をすることの効果は認められるべきと思いますが、そう劇的な違いにも思えません。
+18の選手を+40とか評価しちゃうのはある意味可愛いもんであるとしても+11をしれっと-10とかしちゃうのが危ない。
UZRに対して1260イニング換算の誤差を±5点以内に収めた割合はBCSが25.6%、RFが16.3%。影響が0.5勝に満たず「あまり違いはない」と見られるのは1/4程度ということでしょうか。相関係数は0.6弱。
イニング数の多い選手ほどズレ具合が小さくなるかというとそういう雰囲気でもなく、やはり(偶然でない)バイアスの排除ができていないのでしょう。
誤差と相関がある要素を調べられれば指標の改善に役立てられるかもしれませんが、現状そこまでできていません。
20点程度の誤差は織り込めとか言われてもちょっと話にならないですよねぇ。
あくまでMLBのデータでの話だしUZRが“正しい”保証はないという前提はありますが。

次回は内野手をやろうかと。MLBのデータを扱い慣れてないので少数のサンプル集めるだけでいっぱいいっぱいです。



外野手の守備を数値化

サイトに外野手守備評価を追加しました。一応これで守備のページの体裁は整ったか。
自分なりに根拠を求めながらやったつもりですがそれでも前々からmorithyさんがやられているような方法に近いところが多いのは単純に申し訳ないという感じです。
RRFも改めて研究しなきゃと思っています。結構大胆な手法ですよね。



最近ブログのほうに何も書かなくなってしまっているので結果だけサイトから引用。
2008年の外野手の守備を得点(防いだ失点)として評価したものです。


左翼手イニングNRF守備得点
工藤 隆人443.3 2.24 15.4
村松 有人352.0 2.20 9.9
栗山 巧816.3 1.96 5.4
小瀬 浩之358.3 1.94 0.1
リック938.3 1.79 -9.3
大松 尚逸513.0 1.70 -10.2
松中 信彦463.0 1.57 -10.3
中堅手イニングNRF守備得点
早川 大輔858.0 2.31 7.5
長谷川 勇也403.7 2.38 4.6
鉄平794.0 2.24 4.1
坂口 智隆1153.7 2.19 -1.1
辻 武史327.7 2.12 -1.6
赤田 将吾385.7 2.14 -1.8
森本 稀哲1066.3 2.17 -4.8
栗山 巧302.3 1.96 -7.0
右翼手イニングNRF守備得点
稲葉 篤紀822.0 2.12 10.8
サブロー592.0 2.14 10.1
柴原 洋665.7 2.00 1.0
濱中 治325.0 1.98 -1.1
中島 俊哉391.7 1.92 -3.1
下山 真二669.7 1.89 -5.2
大松 尚逸425.0 1.70 -12.5
G.G.佐藤857.3 1.74 -15.8




左翼手イニングNRF守備得点
和田 一浩1174.3 1.73 16.3
飯原 誉士895.7 1.75 12.4
天谷 宗一郎412.3 1.87 9.5
大西 宏明456.3 1.65 2.3
嶋 重宣556.3 1.67 0.9
ビグビー342.3 1.26 -13.2
金本 知憲1283.3 1.46 -19.8
ラミレス1090.0 1.45 -19.8
中堅手イニングNRF守備得点
赤松 真人779.7 2.26 24.6
青木 宣親985.0 2.02 10.6
鈴木 尚広531.7 2.06 6.4
赤星 憲広1228.3 1.98 4.3
亀井 義行316.0 1.94 -0.6
谷 佳知408.0 1.86 -1.7
森野 将彦551.0 1.90 -2.4
天谷 宗一郎482.0 1.87 -2.6
金城 龍彦1083.3 1.74 -24.0
右翼手イニングNRF守備得点
ガイエル491.3 1.88 5.1
葛城 育郎300.0 1.95 4.8
アレックス1208.3 1.84 2.6
高橋 由伸592.3 1.87 2.5
林 威助317.7 1.74 -2.4
吉村 裕基1214.0 1.74 -4.6
福地 寿樹549.0 1.56 -12.8
李 炳圭817.3 1.64 -13.8



不安だ

積算DIPSを作る


前からちょいちょい挑戦してたネタなんですけど
何かいまひとつ自信がないんですよねぇ……
とりあえず一旦公開。


手直しと追加

サイトをちょこちょこ手直ししたり内容を追加したり。
どうもアップしてからも色々直したくなる性分のようです。読み返して確認した上でアップしているつもりではあるんですがね。何回書き直しても下手だ。直したことはどこかに書いておいたほうがいいですね。
もう2月か……キャンプインか……なんだか早い。


 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。