Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

守備能力の得点化(模索)

ウェブサイトを利用してRelative Range Factorの解説を読みました。
元々のRFに多くの補正項目を盛り込み進化させた指標です。
個人的な解釈ですが、「優秀な集団の中でアウトを独占している者は優秀である」という考えと見られる指標のように思います。
またRelativeの名の通り、これまでは一応奪三振率などの数字と同様独立した値として見ることが可能であったRFですが
見込みアウトを計算して実際のアウトと比較するためRRFの結果は1.081や0.987などリーグ平均を1とした相対値になっています。
そのままだと一見わかりにくいですが、プラスプレイ数に変換すると「平均的な守備者が守る場合に比べて多く獲得したアウト数」となり、直感的にも掴みやすい数字になります。
ひとまず2007年セリーグの遊撃手についてチーム成績として計算してみました。

チームRFRRF Plus Plays
中日(井端)4.83 1.07146.06
広島(梵)5.08 1.04329.86
巨人(二岡)4.80 1.02919.60
横浜(石井)4.67 .966-22.29
阪神(鳥谷)4.56 .960-26.78
ヤクルト(宮本)4.27 .929-46.16

なんだか他所で見る結果と違う気もしますが今はこの結果について細かく論じる気はありませんのでご容赦を。
正しく出来たか自信が持てなくなるほど計算の過程は以前に比べて煩雑です。
遊撃手だけについて計算する際にも他の守備位置の記録とか引っ張ってこなきゃなりませんので。
詳しい計算方法については他所でご覧頂くとして補正の内容としては以下のような感じです。
(尚、読んだ解説は遊撃手についてだけでした。他の内野手についても概ね同じように求められると思いますが)

  • 奪三振補正。投手の奪三振は分母から除く。
  • 投手のゴロ/フライ傾向補正。外野手の刺殺分は分母から除く。
  • 投手の左右補正。左投手が多く投げたチームほど遊撃手に期待される補殺が増え、期待される刺殺は減るものとする。
  • 推計一塁走者補正。多いチームほど遊撃手に多くの刺殺が期待されるものとする。
  • チーム守備力補正。DERの高いチームの守備者ほど優秀であるとする。

これらの補正項目はとにかく総体としてのマッチングを重視しているように思えます。
ミクロを考えた場合、左投手が多くても左方向への打球が多いとは限らないからむしろ補正が逆に働くこともあるんじゃないかとか、一塁走者はあくまで推計だし多くても遊撃手のプレーにプラスに働くとは限らないんじゃないかとか、いくらでも懸念は出てきます。
RFより現実から遠ざかってしまうことも場合によってはあるでしょう。
それでも「とにかくそういう傾向は見られるんだから全体としてみればこっちのほうがいいでしょ」ということだと思われます。
単年の結果を見るよりも数年の傾向を追うことがより大事になってくるかもしれません。
もっとも、左右補正なんかはそれほどの影響は無い場合が多そうです。
DER補正はやや強力で、元々のRFはアウトの分配であることからBIPの観点からの補正は必須だとしてもここの妥当性は重要になると思われます。


で、ですね。目下の関心事はプラスプレイの得点化です。
そこの解説はなかった。
ZRを使った計算例だとかを見ると、遊撃手でプラスプレイあたり0.75とかあったんですけど
個人的にはどうも高い気がしてしまうのです。
XRやBatting Runsの係数を見てわかるとおりそれだと攻撃側に換算すると二塁打1本打ったぐらいの利益になりますよね。
まぁそれはそもそもプラスプレイの数え方が違ったのかもしれませんが
とにかくこのRun Value(得点価値)の部分がどう考えていいものか案外難しいです。
この重み付けによって「守備はどれくらい重要か」ってところが違ってきますからね。
他の方の計算方法についてはまた勉強していくとして
一回自分でも試験的にRun Valueを作成してみました。

ここで言うのは「標準に比べて遊撃手が多く刺殺・補殺を獲得することの平均的価値」。
イベントの加重は全て得点期待値に基づきます。
考え方は以下のように。

  • 遊撃手の打球処理ひとつにつき「単打一般より走者を進める価値の低い単打」を防いだものとして0.41を与える。
  • アウトが重複するプレーについてある程度「守備側利得=攻撃側損失」のバランスがとれるように貢献を分解する。
    具体的には「ベースカバーに入って味方からの送球を受けただけの刺殺」は選手ごとに差がつかない別次元の関与であるものとして無視し、4-6-3の併殺であれば4-6の部分について二塁手のみに得点、6-3の部分について遊撃手のみに得点を与える。以降刺殺と補殺を分けて考える。
  • 刺殺のうちに占める併殺プレーの平均的な割合を求めて打球処理の価値と合算する。
    補殺についても補正の必要性を感じて考慮はしたものの多分ほぼ変わらないんじゃないか、と思う(曖昧)。

という自分で見てもどうも強引な求め方の結果
刺殺=0.30 補殺=0.41
となりました。無論勉強中の一案に過ぎないですが。
見た感じFRの加重に似ている気がします。
どこかで「FRの最大の欠点は(開発者の)パーマーが得点価値をいい加減に決めてしまったことだ」なんて書かれているのを見たことがありますが、先人の偉大さを痛感させられるところです。
もっとも僕は基本的にプレイ数から失策を除くべきではないと思っていますし併殺の扱いなどは逆に思えますが。

これを先ほどのRRFに適用してみると

チームRuns
中日(井端)16.28
広島(梵)8.91
巨人(二岡)7.85
横浜(石井)-6.92
阪神(鳥谷)-9.31
ヤクルト(宮本)-16.77

ってな具合に。
この想定は低めですが打撃のXR+やBatting Runsと比べて無視できるほどの値とは思えません。
年度ごとに揺らぎが結構出るということを考えても、それでも選手ごとに傾向がはっきり存在することは明らかになっており
その意味での信頼度は打撃とそう変わらないのではないか、という感じもします。
パークファクターの補正はないですがMLBでZRベースでも±20ぐらいの得点換算値になるところを見ると「マネー・ボール」で紹介されたレベルの守備の扱いができるかどうか。

ちなみに各選手を追ったRRFの傾向から、ざっくり言って「若いほどパフォーマンスが高い」ことが報告されています。
30を過ぎたらはっきりと落ちてくるようです。
技術の成熟などの観点から年を取ってもむしろよくなったりするのかななどと想像もされますが、肉体の衰えに勝つのは難しいようですね。
今年のセについてもBIPあたりのアウト関与でざっと見てみましたが坂本はかろうじて平均以上でした。
ぎこちなく見えるところはありますが、プレーが成立すれば見た目はどうでもいいわけですからね。
技術の拙さを若い力がフォローしているのではないでしょうか(ただ今年に関しては井端が相当悪いっていうのが気になるところですが)。


ロクなまとめもしないままに余談ですが
捕手の守備プレイの統計評価も改めて考えていて、一旦「物語」から離れて物理的側面に絞って捕手の働きを見ると「基本的に座って球受けてるだけのやつ」に見えてきます。
さすがにそんなふうに結論付けるつもりはありませんが、細かいデータから野球の考え方についての大きなヒントが出てくるのがこの種の分析の何より面白いところです。


追記:ZRには得点化のためにかなり詳細な運用方法があるみたいですね。
考え方の参考にするにはきちんと理解しないといけないようです。
「刺殺・補殺」でもやっぱり0.47ぐらいいくのでしょうか。
また、当初の計算に間違いがあったようなので修正しました。

スポンサーサイト

星野監督がタイブレーク制導入に激怒

http://sports.yahoo.co.jp/hl?c=npb&a=20080727-00000031-nks-base

直前にいきなり言われたってことについてとりあえず声を荒げておいて、あとは適当にやればいいんじゃないでしょうか。
別に閉鎖的な「野球」に拘らなきゃいけないこともないし、そうなったらなったで僕はあまり魅力を感じないかもしれませんし。
今回の話と直接繋がるかはわかりませんが、「伝統だから守る」みたいのって好きじゃないんですよね。
方式が日本に不利かどうかはあながちなんとも言えないと思います。

ところで最近セ・リーグでもDH制を導入して欲しいとぼんやり考えます。
投手の打撃成績はどんどん下がってきているということで、ほとんど打てないわけですから、その打席を見るなら他に見たい野手がいるかなと。
単に好みでしょうけどね。
ただ「野球とは」なんていうのは誰に律する権利があるものでもないと思うんで、結局は好みの集合でしょうから。

得点効率の見積り

チーム単位での「得点/XR」の計算が、得点効率を計るひとつの方法として知られていますけど
最近ちょっと疑問だったりもします。
もちろん、簡易的な方法として一定の合理性を持って行われていることに関して文句は全くないのですが
犠打犠飛の扱いとかNPBに当てはめると大きめの数字が出がちとかいうことを除いても
細かく言うとXRって、数字の性格からして、そういう用途に合うのかなぁと。
XRの係数は回帰の元の中で最も当てはまりの良い値であって、野球の仕組みを考えるとチームの打撃レベルに応じて真実の中の係数は変わるんじゃ。

ちょっと色々考えてこんがらがってるんでざっくり言うと、例えばよく打てるチームならイベントひとつあたりの得点寄与はXR(全体の平均)の側から見ると自然と上がってきて、単純に得点の多いチームは得点効率が良いように出るんじゃないかってことです。
でもその打撃レベルの中で言うと実は効率は普通なのかもしれない。
「得点効率」を「当該の打撃イベントが揃った場合に見込まれる平均的な得点に対する上積みの多さ」っていうふうに考えた場合です。
XRが「当該の打撃イベントが揃った場合に見込まれる平均的な得点」かというと、厳密に言うとちょっと違うんじゃないかと。
高い合理性をもって近い値は出せるけれども、加算式の限界としてどうしても平均的な範囲の見積りをしてしまい回帰元のデータと傾向がズレてくればくるほど現実と違ってしまうなら
得点の高いチームを過小評価して、低いチームを過大評価して、結局のところ「得点/XR」は概ねただ単に得点の高低を見ることになってしまうのではと。
合理的に得点予想をするにはXRは非常に有用ですが、得点効率を計る際の対象にするには少し論理的な問題を生む気がします。
回帰分析についてほとんど勉強もしてませんし見落としもありそうなんでアレですけども。

そんなこんなで、得点効率を推し量るための比較対象には理想的にはシミュレーションモデルでも使ったほうがいいんじゃないかと思ったりするわけです。
RC(乗算式)はRCで高い打撃レベルの際に過大評価した見積りを出すとか言われますしね。
Base Runsとかいうのは勉強中ですが、これはチーム単位の指針としてはいいのかも。
ざっとここ16年ほどのNPBに当てはめてみると、犠打とか犠飛とか併殺なんかの項目を含まないわりにXRと同等の実得点に対する相関を見せます(※1)。
得点効率の比較対象にするならXRよりベターかもしれません。
ただ「得点/XR」も「得点/Base Runs」も示す傾向はほとんど同じなので些細な問題かもしれませんけどね。



※1……今回相関とった範囲での係数はXR .966、Base Runs .965ですが、チーム単位の得点との相関だけなら結構適当な式でも出るんですよね。
塁打で.896、塁打+四死球で.949。試合あたり平均得点とOPSで.940。
総合指標の「答え合わせ」はこうしてチームレベルの結果で行われますが以上を見てわかるようにチーム単位でそれなりの当てはまりを見せるからといってそれを個人に適用する場合の妥当性まで保証されるかというとそれは違うと思います。
塁打+四死球が積み上げの評価としてOPSの代用になるかというと、本塁打の価値が単打の4倍というのはおかしいだろうとすぐに気がつきますからね。
チーム単位ではなんだかんだ言っても出塁率:長打率がそんなに偏ることはありませんけど個人では大きく偏ることもありますのでそこに対応できるかどうか、OPSとGPAの違いもやっぱりそこだと思います。
しっかし、恥晒すだけなので統計の素人があんまり深入りしないようにしようとは思いますが(汗)

打撃成績を分解する

阿部慎之助8年連続10号本塁打達成記念(?)で。
以下は入団以来の打撃指標です。

Year AVG SLG OBP OPS
2001 .225 .373.293 .666
2002 .298 .478.377 .854
2003 .303 .500.392 .892
2004 .301 .625.391 1.016
2005 .300 .498.365 .863
2006 .294 .427.349 .776
2007 .275 .513.355 .868
2008 .264 .440.332 .772
Total .283 .483 .358 .840

開幕の大不振が尾を引き悪い悪いと言われてきましたが今年は確かに良いとは言えなそうです。 
1年目を除けば総合指標でワーストなわけですから。
2004年のOPS1超えなんかはもちろん素晴らしい傑出はあったものの飛ぶボールによる上乗せがおそらくあるでしょうからそれより低くなるのは仕方ないにしても、年齢的に脂が乗っているはずの時期と考えればもうちょっと高い成績を期待したいところ。
でも、どこが悪いんでしょうか?
「右肩の開きが」とか「下半身の安定が」とか肉体的なレベルの話じゃなく結果として出ている問題はなんなのか。
NPBで得られるデータで大体打者の特徴が現れる部門は「四球率・三振率・本塁打率・BABIP」だと思います。
この前の記事で年度間の動きを確認したとおり、前者の3つに関してはどうやら打者の実力によって偶然のブレが少なく推移するのではないかと考えられます。
逆にBABIPは不安定で、打者の力量によって制御しきれない偶然の力が強く働く要素だと考えるのが妥当なところだと思います。
つまり、四球・三振・本塁打に大きな変化があった時に実力の範囲を疑うべきで、BABIPによって成績が上下している場合に関してはたまたまである可能性が高いってことですね。
もちろん、打者によって有意差がありますからBABIPに依存した成績でもたまたまでない可能性は大いにありますが。一般的には、です。
具体的に阿部の成績を分解してみます。

Year BB CON HR BABIP AVG' XBH/AB
2001 .074 .796.034 .250.262 .080
2002 .093 .820.040 .329.274 .099
2003 .112 .836.048 .319.284 .099
2004 .102 .770.087 .313.292 .148
2005 .096 .838.055 .310.289 .088
2006 .072 .833.022 .334.265 .084
2007 .101 .851.066 .260.301 .106
2008 .078 .852.035 .280.280 .106
Total .091 .825 .049 .300 .281 .100

BB・HRは機会あたりの率で、CONというのはコンタクトパーセンテージ、要は「三振しない率」です。
こうして見ると、意外かどうかわかりませんがここ2年は三振は少ないけどBABIPが低いのです。
去年は打率こそ低かったですが大雑把な打撃だとは言い辛いと思います。AVG'はBABIPを3割で揃えた場合の打率ですが、それなら2007年が最高になります。
今年など、やけに大きな空振りを見るシーンが多い気がしますが三振の少なさで言えばここまでキャリアハイ。
去年と比べて悪いのはやや四球が少ないのと、本塁打が半分くらいになっちゃったことですね。
BABIPは去年より高いのですから、打率の不足分はまさにこの本塁打の分です。
では遠くへ飛ばす力が全然発揮できていないのかというと、実はニ塁打が例年になく多く、もう去年と同数になっているってところが気になります。
つまり「本塁打」という縛りから抜けて「長打の数」と見ると、XBH/ABと表記したものですが、去年とほぼ同じです。
これを見ると一定数ちゃんとした打球は打っていて、それが「フェンスを越えていないだけ」に見えなくもないんですよねぇ。
二塁打は阿部自身の標準から比べて5、6本多いと評価できますが、この6本についてフェンスを越えていたとすると16本塁打、長打率は5割近くなっています。
もちろん、本塁打を実力と見る以上、その「フェンスを越えていないだけ」ってのが大いに問題なわけですけどね(特に東京ドームのパークファクターを考えると)。
BABIPの観点から、たまたま二塁打が出ていると見たほうが自然かもしれませんし 故障があったことも、振りが良いように見えないのも事実で。
ただこれまでのシーズンだってそんなに順風満帆で過ごしてきたわけじゃありませんし今年についてどこかしらの数字が特に悪いかっていうと、そうは見えません。
どちらかと言うと問題だったのは2006年で、キャリアハイのBABIPによって打率が良かったためにあまり文句は出なかったかもしれませんが、パフォーマンスが悪く得点的な貢献は例年に比べかなり低めな年でした。


なんかもうちょっと一般的なテーマとして意味ありげなことを書きたかったんですがただダラダラ書いただけで時間くってしまいました。とりあえずここで。

やっぱりわからない

考えれば考えるほどリード(主に配球について)って評価が難しいですね。
ファン側ではなんとなく「○○はリードが良くない、△△はさすが」だとかレッテルが貼られて、一部の捕手に関してそれが当たり前のように語られますが
そうなのか?本当にそうなのか?と考えると答えは出ないような。
僕もわかったつもりになってなんだかんだ言ってみることはありますが、心の底にはどうせわからないというあきらめがありますよね。
「裏」と「裏の裏」のふたつ使うだけで全部の配球について肯定も否定もできてしまう気もしますし。

完璧な証明を見たいとは言いませんが、リードについて大筋で納得できる客観的な評価には結局一度も出会ったことがないかもしれません。
個々の事例について、「確かにそうとも言えるかな」って解説がポツポツあるだけで。それについてもやっぱり逆のことを言ったら絶対にダメなのかの答えも出ませんし。
先行のイメージありきで、印象の良いA捕手についてはプラスがあった時だけ数え上げ、印象の悪いB捕手についてはマイナスがあった時だけ数え上げ、「ほらやっぱりAのほうが良い」って言っているように見えるシーンもあります。
守備のイメージは遅れてついてきて一度つくと変わりにくいっていうセイバーメトリクス的な分析からの傾向と同様なのかもしれません。

結果論しか言えないなら結果論だけでもいいんですけど、気まぐれに取り上げたり作為的に取り上げたりしないでとにかく全体について徹底的に結果論を集めてみたいですね。
プロの中で、そんなにリードで差がつくものなのか。
「変わらないだろ」と言いたいんじゃありません。「わからない」んです。
僕にとっては少なくとも当たり前のように言い切れるものじゃないですねぇ。

五輪メンバー

http://www.npb.or.jp/alljapan/2008olympic_roster.html

まぁ、こんなところなんじゃぁないでしょうか。
細かいところで「こいつよりあいつがいいんじゃない?」っていうのはあり得ますが
待ち受けている不透明なファクターの影響の前では大同小異というか、このメンバーで戦ったとして後悔はしない面子なのではないかなと思います。
新井とかは故障大丈夫なのかって気になりますが。

捕手は三人でしたね。
阿部は本人が「成績が伴っていない」と言っているようですがセの捕手で最も打っているのは彼ですし。
里崎も国際大会の経験から考えれば妥当だと思います。
外野手は打率・四球・長打兼ね備えた四人。
投手陣は何か継投が大変そうというところですかねぇ。


追記:スポーツニュースで星野監督が話してるのを見ました。マー君にはフル回転してもらうって発言があったんですね。
継投で大変そうと書いたのはリリーフの専門家が少なく見えるのと、多分「雑用係」が必要だろうというところです。
ある日立てた先発投手が初回から全くストライクが入らなくてダメダメですってことがあった場合に、ペナントレースのような長期戦ならばそれはもうあきらめるほうがいいでしょうが五輪で短期決戦のような場合にそうもいきませんから
「いつでも準備しておいてなんかあったらすぐ出て行って繋ぐ要員」として働く人が必要。正規の先発・リリーバーにそんな負担はさせられませんし体力的な問題で若い人にじゃないと注文しにくいでしょうから、そこで田中なのかもしれません。予選で長谷部が選ばれた時は疑問視する声もありましたが個人的に意味はそういうところだと思っています。
順風満帆にいった場合には登板がないという役回りですから評価されにくいかもしれませんけどね。
まぁ、単純にその役割だけを考えるならフレキシブルな中継ぎ登板にある程度慣れていて制球が良く初見で打ちにくいような癖をもった感じの投手が良いだろうと思われ、田中が特に合致しているとも思えないので他に期待していることがあるんでしょうけど。


守備観

A.守備力が失点に及ぼす影響は大きい
B.近年の巨人の守備は悪い
C.守備力の失点への影響は安定的である


守備のスタッツなどいじったりしているのでそもそもの守備へ思っていることを書いておきたいと思いますが
さて上記のA・B・C、どう思われますでしょうか。その通りか、間違っているか。

例えば「守備固め」は、スタメン選手を休ませる目的もあるかもしれませんがその名の通り守備を固めてよりリードを守りきりやすくするために行われているようで、守備が失点に対して重要であると信じられているが故でしょう(A)。
で、巨人について。特に守備に良い評価は聞いたことがありません。
例えば2007年なら、二岡の遊撃守備が限界だったとか、阿部もずっと評判が悪いですし、センターはホリンズでしたし、小笠原や脇谷に関してもあまり良い評判は……
世間的な評価では巨人の守備は悪いとされている気がします(B)。
そして「守備の良いチームは安定して戦える」というような格言(?)があります。
曰く「打線は水物」であって、打線に頼ったチーム作りは賭けみたいなものという扱いが時に見受けられます。確かに守備に定評のある日本ハムなど、ここのところ高い成績を叩き出しています(C)。

ではABC全部「正解」なんでしょうか?
投手が三振ばかりとれるはずもなく、一試合で数十回フィールドに打球が飛ぶことを考えれば
それを野手がまともに処理する能力がなければ失点が増大するのは当然と言えます。
しかしお遊びの野球ならいざ知らず、果たしてプロ野球のレベルで守備力でそれほどの差がつくのでしょうか。
冒頭のABCを全て肯定できるのか。

以下は直近3年の巨人の失点率。

2005---5.10(5)
2006---4.14(3)
2007---3.88(1)

著しく良くなっています。カッコ()内はリーグでの失点率順位。
ここでAをその通りだと仮定してみましょう。
守備力は失点率に強く影響する。それならば失点率が良くなるところには守備力の改善があるべきです。
巨人の守備力は近年非常に改善されているということになります。
2007年は2006年に比べ守備力に定評がある小坂誠や若く身体能力に優れた鈴木尚広、矢野健次、亀井義行あたりの出場機会は減っていますが、結果はそういうことです。
そのように、原則的に考えればAを本当だとするとBが嘘になりますね。
Aによると失点率と守備力は相応の相関関係を持つはずなので。
仮に、守備力は重要で巨人は守備力が悪かったけど投手力のおかげで失点が少なかったのだとしても、それは結局守備力が低くとも投手力によってリーグ最優秀の失点率を記録できること、すなわち守備力はそれほど重要とは言えないことを意味してしまいます(あるいは巨人投手陣の超異常な傑出を示す)。

AもBも本当であるとすることは「守備力は失点に強い影響を与え巨人の守備は悪かったがリーグで最も失点が少なかったチームである」という主張になり、かなり無理がありますね。
最後のC、「守備力の失点への影響は安定的である」を覆すことによって基本的に守備は重要で巨人の守備は悪いが2007年の巨人は例外でたまたま失点が少なかったのだ、と言うことは出来るかもしれませんが、それもまた結局守備力など強化しても勝利に結びつくとは限らないということを意味し、野球観としての「守備は重要である」と矛盾しかねません。
巨人の結果が例外であるという主張と原則として守備は重要であるという主張は、少なくとも緩い矛盾の関係にあるのではないでしょうか。どちらかを強く主張すればどちらかは立ちにくい。

このように考えていくと、冒頭に挙げたA・B・Cは一般的に当たり前と思われていることのようでいて
同時に主張しようとすると事実との矛盾を生じる気がします。
BとCを本当として、守備は安定的に失点に影響するし巨人の守備は悪いとすると、巨人の失点率推移から守備の悪いチームでも優れた失点率を記録することができることになって、守備力は重要とは言えない。つまりAが嘘になります。
AとCを本当だとして守備の影響は大きい上に安定的と考えると、最優秀失点率を記録した2007年巨人の守備は良いと言わざるを得ません。

以上のような考えから、以下の3つのうちひとつ以上は本当になってくるのではないかと。

A.守備力が失点に及ぼす影響は小さい
B.世間一般の主観的守備力評価は実態に即していない(巨人の守備は良い)
C.守備力の失点への影響は不安定なものである

特に最近Cを怪しいと思っています。
やたらと「守備の良いチームは安定する」が当たり前のように語られますけれど
確かに打撃結果に比べて守備の動き、野手の周辺に飛んできた打球を処理する内容は安定しているかもしれませんが右中間真っ二つの打球なんかはどうしようもないわけで、それら打球分布は守備者からすれば知ったこっちゃなく
守備の失点への影響は気まぐれであるという認識でも不思議はないような気がするんですよね。
守備にスランプがなかったとしても、その守備の失点への影響が不安定だったらアテにするようなものじゃないんじゃ。
もちろん守備の動きが悪いより良いほうが良いに決まっていますけど。
現在はそんな感じで考えてます。
また今回は最近でわかりやすいところと思い巨人を取り上げましたが他のチームの失点と定説・評判を照らし合わせてもどうも噛み合わないことが多いようです。
リードとかもこういう見方で少なくとも現実の説との矛盾は出てきそうですねぇ。「どうとでも言える度」は遥かに高いので難しいかもしれませんが。

Clutch

いやはやちょっと全米のほうを見渡すと本当に色々な指標が見られますけども
Clutchってのはなんなんですかね。
一般的には勝負強さなんかを表す語ですが、具体的にビル・ジェイムズによるRuns Createdの一部に"Clutch"という評価があるようで
前から存在を知ってはいたんですが実際どのように使うのかがイマイチわからないんです。

計算式は

有走者本塁打-(有走者打数×本塁打/打数)+得点圏安打-(得点圏打数×打率)

ってなもんで、一言で言うと「全体の成績に対して有走者・得点圏時によく打っている」ことの評価になりますでしょうか。
最近見つけた計算例では上の式で求めた値をそのままRCに加算していたんです。
データの見方について色々と勉強するまでは得点圏打率は魅力的な数字だと思っていましたが今は単純にそれを評価していいのかは疑問を持っています。
勝負強さを表しているかどうかとか年ごとの再現性を語るまでもなく
出塁の連続によって得点するためにはまず走者無しから出塁してそこで「決める人」に回るわけで、どちらも重要なはず。
打点は、リレーで言えばアンカーだってだけで、1位になったとしてアンカーだけの手柄なわけはありませんから。
「得点圏打撃/非得点打撃」の比が極端に偏るのはチーム全体の得点効率から見て必ずしも喜べないんじゃないでしょうか。

具体的に言えば打率に対してすごく得点圏打率が高い人は、逆に言うと得点圏に走者がいないときはあんまり打たないってことです。得点圏じゃないときに打ってくれる人がいないと得点圏が生まれませんから得点圏打率ばっかり高くてもしょうがない。
思えば一頃の今岡がそんなことを言われていた気がしますね。もっとも、チーム状況的に偏ってそれを期待されている打者がそのような結果を残すことは評価に値すると思いますが、ここでいうClutchは単純に打者の優劣を表すものじゃなくて良い打者でもチャンスメークを得意としていればマイナスに出る数字です。
「得点圏打撃/非得点打撃」の比は良い悪いじゃなくてタイプの問題な気がして、総合指標にただ加えるのがどうも腑に落ちないんですよね。総合指標の考え方ってそういうものなんだろうか。
多分英語をマトモに読めなくて理解できていないのが問題だと思うのですが、誰かに教わってみたいものですね。

ちなみにですがClutchを求めるには走者状況別の打撃成績が必要なので、NPB公式サイトあたりの情報では不十分ですね。
yahooとか利用して一人一人計算するしかないと思いますが、全選手に対して出すのはだいぶ面倒そうです。
一応セの4番について計算してみるとこんな感じに。

ラミレス 5.97
村田 4.45
畠山 1.90
金本 -0.24
栗原 -4.28
ウッズ -9.35

骨折?

日本ハム・中田が骨折=全治1カ月、遠のく1軍-プロ野球
2008年7月14日(月) 20時35分 時事通信

 2軍で調整中の日本ハム・中田翔内野手は14日、都内の病院で痛めている左手の検査を受け、「左手有鉤骨(ゆうこうこつ)鉤骨折」と診断された。16日に手術を受ける予定で、全治1カ月の見込み。フレッシュオールスター(8月2日、山形)出場が絶望的になったほか、1軍昇格が遠のいた。
 中田は6月14日のイースタン・リーグ西武戦でスイングした際に左手首に痛みを感じて交代し、その後の公式戦を欠場。当初はねんざとみられていたが、この日骨折と分かった。梨田監督は「期待していた選手の1人だけに残念としか言いようがない。焦らずじっくり治療に専念してもらいたい」とコメントした。
 中田は高校通算87本塁打の大型スラッガーとして、高校生ドラフト1巡目指名で入団。守備の力不足などから開幕を2軍で迎え、今季中の1軍昇格を目指していた。

http://sports.yahoo.co.jp/hl?c=npb&a=20080714-00000137-jij-spo



正直、今季中の一軍とかはどうでもいいんですが
問題の箇所に大きな負担がかかるような何かがあったって報道ありましたっけ?
この記事にはスイングとだけあるし周りは「手術?必要ないでしょ」って感じの冷めた反応だった気がするのですが。
こういうのを聞くともしかして「ケガに弱いヒト」なのではないのかと心配になってしまいます。
とにかく一発に期待が持てるんだって素材は今の日本球界では貴重ですからね。大きく育って丈夫に活躍してもらいたいものです。
堂上直あたりのファームでの成績もちょっと冴えないんですよねぇ。

でこぼこ

前にパークファクターに触れたのは一ヶ月ほど前でしたかね。
ここで言うのは球場ごとの本塁打の出やすさですが
西武ドームが西武打線の所構わない量産の中1.319と落ち着いて(?)いるのに対して東京ドームは未だ1.950。
東京ドームって例年は平均的ではなかったかな?
NPBで過去には2とかもあったようですがメチャクチャな値ですね改めて考えると。
まぁ、まだシーズン半分といえば半分だし諸々の要素も偏っていると思われますが。
というか本塁打なんてイベントの性質からして年間でも心許ないんでしょうね。
メジャーでは数年間の平均とか見たりもするようですけど、日本ではボールが統一されていないからそういうこともできない。厄介です。

能力値的な評価を考える上でちょっとパークファクターを勉強してみようかと思ったんですが
メジャーに比べるとNPBはだいぶ気まぐれっぽいですね。

やっぱこうなるのか

既に同じ様な発表を複数の場所で見かけていますけど、自分なりのデータとってみるのが自分にはわかりやすいので。
打者について「ある選手のある年の○○と翌年の○○」の相関。

HR/AB0.804
SecA0.770
SO/AB0.739
SLG0.682
BB/PA'0.682
OPS0.634
HBP/PA'0.614
RC270.611
RC/PA0.601
OBP0.537
BA0.305
BABIP0.265

素人なので統計のやり方・見方が見当違いだったらすみません。先に謝っておきます。
2005年~2007年NPBが対象で
あんまり打席数が少ないと変にバラつくように思えるので、対象サンプルとする成績の足切りラインは大体1試合に2打席ほど立つことを前提として300打席以上としました。
そのぐらいに絞った結果サンプルの数が少なくなってしまったのでちょっと乱暴ですが両リーグ合わせて。結果138サンプル。
僕から見ても考慮の余地は色々あるような気はしますがまぁ傾向はわかるのではないかと。
ちなみに「HR/AB」だったら「打数あたりの本塁打数」ということです。「PA'」は出塁率の分母。

で、結果はご覧の通りで、載せたもの以外にもいくつか指標は計算したんですが主な事象の年度ごとの相関の強さとしては

本塁打率(とそれに伴う長打力系指標)>三振率>四球率>>>インフィールド打球が安打になる確率

となるようでやっぱり他で聞いた通りですね。
本塁打を打つのは実力としてアテになるようです。
長打力を頼りにした補強とかは得点寄与の高さから考えても結構良い手な気が。
BABIP、本当に低い。
最後に打球の行方を決定する打者が実力でどうにかできないと考えると、DIPSの考え方は打者側からも間接的に支持されるように思えます(ただしこのデータからは投手ごとのBABIPが安定しているかどうかはわかりませんが)。
本塁打の多い打者は強い打球を打てるからBABIPが高いんじゃないか、とか、三振の多い打者は当てるのが下手だから当たったとしても弱い当たりが多くてBABIPが低いんじゃないか、とか考えてもそういう関係も見られないのが厄介なところ。
打率は本塁打率と三振率に挟まれる分BABIPよりはマシですがそれなりに打数を積んでいようがアテにならないようですね。
あと、薄々感じられてはいることですが死球も完全にランダムで起こっている事故とは言いにくいものがあります。

打率を基にした戦力予想みたいなものは、二重の意味でアテにならないことになります。
過去と同じ様になる確率が低いということと、打率が得点の実態を表していないこと。

とにかくBABIPをどう扱っていいものか。
イチローや青木のようなタイプだとか一部の打者はBABIPが安定して高いというふうに表現されることがありますが
年度ごとのブレという観点から見ると特別にBABIPが“安定している”わけではないように思います。
高いという水準に居ることが多いという話であって、その中でやはりブレている。
思うに「BABIPが高い能力/低い能力」がなんとなくはあっても「BABIPを安定させる能力」は特にないんじゃないでしょうか(安定している打者がいないというのではないです)。
もちろん高いならそれだけで良いことなのですけどね。打率とかよりさらにサンプル数が少なくなる数字とはいえ実力での操作ということを考える上では問題になるような。
成績予想とかはBABIPのところで相当難しくなるんでしょうねぇ。

古典的なスタッツ

最近セイバーメトリクス系の、比較的古いスタッツ、指標について勉強しています。
例えば「打者が何得点分の貢献をしたか」ということを表すには最も代表的なものでRC、そのほかXRなどありますけど
Batting Runs(直訳すれば打撃得点、となりますかね)というものは以前よりポピュラーだったようです。
多分読めないであろう英語の分厚い本を買う気合はないので浅い知識ですが一般的な式は以下。

BR = (0.47*1B)+(0.78*2B)+(1.09*3B)+(1.40*HR)+(0.33*(BB+HBP))+(0.30*SB)+(-0.60*CS)+(-0.25*(AB-H))

局面ごとの得点の期待値を基にして各攻撃イベントが平均して期待値にどのような変化を与えるかを計算したもので
単打や二塁打それぞれに適切と思われる加重をしていくという、考え方がわかりやすいですよね。
そもそも平均的な得点を見込んだ上でそれに対する増減を評価するので、平均的な打者がゼロになるというもの(打数-安打はアウトを表してますね)。
XRに比べると評価項目の緻密さで劣るかもしれませんが簡潔でわかりやすいという意味では良い指標な気がします。
アウトの重みをリーグに合わせる、パークファクター補正をする、最終的にWINに変換するなどの運用があるようです。

守備指標はFielding Runsというものを見つけましたがちょいと不思議ですね。
Webで見たのは例えば
該当守備位置リーグ全体の 0.2*(刺殺+2*補殺-失策+併殺) を求めリーグの総刺殺から総奪三振を引いたもので割り「平均」として
各選手の 0.2*(刺殺+2*補殺-失策+併殺)-((チーム総刺殺-奪三振)*平均*出場率) を計算するというものですが
レンジファクター的な方法で守備貢献を求めて、平均的な守備者と比較することで得失点を計ろうというのはわかるのですが
補殺が刺殺の2倍の得点価値を持っていることになってますよねこれ。
それに関していまいちよくわからない。補殺のほうが能力を求められる的なことが書いてある感じもして、刺殺は受けるアウト、偶然的なもので選手同士比較するようなものではないという思想なのかもしれませんが難易度なんかが得点的価値に影響を及ぼすとも思えませんし。
刺殺と補殺でひとつあたりの価値が違うということ自体は十分考えられると思いますが。
あと投手のゴロ/フライ補正、左右補正がないとかの指摘があるのはクラシックなレンジファクターと同じことですね。

ただ最近個人的にはレンジファクター系の一番の問題は結局のところパークファクターと偶然的な打球分布や巡り合わせによるブレで、一年とかじゃそれなりに大きく出てしまうんじゃないかなと。
それに比べればずっと言われている「隣の守備者の能力で云々」とかはあったとして些細な影響なのではないかと思っています。
もちろん色々な補正を加えてベターにすることは素晴らしいのですけど。
とにかく基本的な考えとしてはアウト獲得の多さを評価し「平均的な選手が守るのに比べていくつ失点を防ぐか」ということが表されます。

そんなこんなで試しに聞きかじった算出方法でそれらの指標を使ってみました。
Batting Runsはアウトの重みをリーグに合わせ、盗塁の得点(SBR)は 0.22*SB-0.38*CS という形で、2007年セ・リーグの遊撃手6人の総合貢献を。

選手BRSBRFRTotal
井端 弘和4.65 2.78 9.75 17.19
二岡 智宏8.07 -0.54 9.01 16.54
梵 英心-1.39 2.12 12.13 12.86
鳥谷 敬-3.90 0.02 -0.34 -4.21
石井 琢朗-13.86 -0.58 10.18 -4.26
宮本 慎也-5.70 0.28 -18.80 -24.22


こんな感じで総合的な貢献が求められます。
井端は全項目がプラスなのでなんとなく気持ちがいいですね。
大体得失点の1/10がWIN(勝利)なので、ごく平均的な遊撃手を除いて井端を入れた場合2勝くらい増える、というような意味になります。そのような評価方法で「この投手とあの野手どっちを補強するのがいいだろうか」ということも比較可能。
宮本の守備貢献がやたらと低いのは守備指標が不完全な故の気まぐれとしても打撃貢献までマイナスなのは(この年曲がりなりにも打率3割)意外かもしれませんが
長打がなく四球が少ない打者は総合的な評価では高く出ないってことですね。
基本的なとこおさらい。

追記:上記の値は機会数を合わせていないので出場の多い選手ほど絶対値が大きく出ています。
例えば二岡は井端より出場が少なくてこの値なので同じくらいの打席数・守備機会とすれば井端以上の数字になります。
ただしもちろん、より多くの機会を得ても同じパフォーマンスを発揮できたか否かは不明です。

やっぱつえぇわ

青木宣親。
福留が渡米してセ最強打者と目されていた彼ですが故障とかあり心配していたところ
7/1時点でRC27(一人で全打席担って一試合やったとした場合の得点)9.09ですか。
青木と知らなければあんな屈んだクネクネした打ち方で打てるのかなと思ってしまうような見た目ですが
やっぱすごいわ。
あの姿勢でジャストミートして打球をあの角度で運べるんだもんなぁ。
神宮の芝の変化がヒットを打つのに少し不利に出ないのかなとも思うのですが
パークファクターについて詰めていないからわからないし、不利だとしても気にするほどの実影響は出ないのかもしれません。
RC27で言えば、金本の9.23にも引いてますけど。
(現時点では、金本がリーグ最強打者だと認めざるを得ないでしょう。年齢から考えれば驚きです)

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。