Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

サイトをプチリニューアル中で

セイバーメトリクスに関する基本的な説明というのも少し練り直そうとしているのですが
わかりやすく説明しようとしているうちにいつの間にか俺定義になって歪な文ができてしまう感じで、難しいですね。
そもそもセイバーメトリクスを啓蒙したくてサイトをやっているとはいえ他人に説明するほど「わかっている」人間じゃないから最初から無理があると言えってしまえばそれまでなのですが。

リアルではおそるおそるセイバーメトリクスなんて単語を出しても普通に反応ナシなのでつい「実はこういうものなんですよ」って態度が染み付いちゃっていますが、ネットでは識者の方々に「こいつはまた浅いこと書いてんな」と思われてしまっているでしょうかねぇ。もちろんそんな状況であるならそれはそれで本望なんですけれども。

あとはサイトにポール・デポデスタという名前は何回か出してるのにビリー・ビーンの名前は出してない気がするとかどうでもよさげなことを思ったり、検索してみたら実は「ビリー・ビーンGMの補佐役であるポール・デポデスタ」という形で地味に出てたり。実際どうでもいいですな。


スポンサーサイト

ほおー

セパ“戦犯”選手は? 前半戦総括「裏オールスター」

RSAAとRCAAを使って投手と打者を同じ土俵で比較とは、なかなかいいじゃないですか。
個人的には結構面白いです。
そりゃある意味私みたいに普通の野球ファンからすれば病気に近い人間からすると「もっとこう……」というのはなくはないですが、メディアの性質上仕方がないところは色々あるでしょうし、おかしなことをしているとは思いません(言い方、上からですみません)。
ありがとうZAKZAK。

まぁ、でも選手が気の毒な気もするのでひとつフォローしておきましょうか。
RSAAとRCAAはリーグ平均と比較しての数字で、結果が悪いならば出場が増えるほどにマイナス数値が増えていきます。そもそも出場がほとんどないような選手はこの表に載ってきません。
それで何故マイナスなのに出場が多く数値が大きくなっているかといえば、それはだいたいチームの状況によるところだと思います。成績は悪いんだけれども、それでもそいつが相対的には一番良いから使っている。
例えば防御率5.00の投手がいたとして、RSAAは確実にマイナスになりますが、その投手を使わなかったとしてあと残りの控えには防御率6.00以上の投手しかいないならば、5.00の投手は投げないより投げるほうが(自身のRSAAのマイナスは増えますが)チームの損失は減らしているとも言えるんです。
だからといってその選手が悪くない、というのも違うのですが、平均と比較してマイナスだからといってその選手がいないほうがいいとは必ずしも言えないというわけです。


ダルビッシュ史上最強! 少ない失点記録が証明

せっかくなので(?)道作さんが協力された記事に丸のっかりしてなんか書いてみましょう。
まだ読んでいない方は、まずは下の記事を読んでみて下さい。


ダルビッシュ史上最強! 少ない失点記録が証明


いやぁ、すごいですねダルビッシュ。
歴史的な投手を目の前にしていると言われてもあまりにもいつも当たり前に抑えているのでかえって印象がなかったりする気もしますが。

このPitching Run(Pitching Runs、と言いたくなるけどダメなのか)というのは、記事にある通り
「同リーグの平均的な投手と比べてどれだけ失点を防いでいるか」を表す指標です。より野球規則に沿って言えば、失点ではなく自責点。

そして、ここでいう「同リーグの平均的な投手」というのは数理上のものです。
ちょっと計算してみましょう。
現在までで、パ・リーグ全体の投手成績では4464 2/3イニングで2036の自責点が記録されており
自責点と投球イニング数で割ると1イニングあたりの自責点が求められます。

2036/4464.67=0.456

この数字は登板した全ての投手の実績を含めた平均ですから、今年のパ・リーグの平均的な投手は1イニングに0.456の自責点を負う、というふうに考えられます。
そして平均的な投手がダルビッシュと同じ137イニングを投げたら0.456の137倍で62.48の自責点になります。
実際のダルビッシュの自責点は20。最終的に62.48と20の差分42.48が、リーグ平均の投手が同じイニング数を投げると仮定した場合に比べてダルビッシュが防いだ失点(自責点)というわけです。
記事の通りの結果が確認できました。

(あ、ちなみにPitching Runの数字、今後減ることはあり得ますよ。ダルビッシュが次のイニングに50点とか取られたらマイナスになってしまうっていうことは上記の計算からわかると思います。防御率が平均より悪い投手はマイナスの値がつきます)


これを、例えば1996年のセ・リーグの投手について算出する際には当然リーグ平均の数字は1996年セ・リーグのもので計算することになります。
そうすれば「斎藤雅樹とダルビッシュのどちらが良い球を投げたのか」なんていうことはわからないのですけれども
戦いを行っている対象のリーグの中でどれだけ利益を生み出したかという点は客観的に比較できるわけです。
こういうやり方がセイバーメトリクス的な歴史的評価のひとつの方法ですね。道作さんがサイトで詳しく解説されている傑出度というやつです。
「普通の」野球の指標にわざわざリーグ平均値を算出して比較するようなものはありませんけれども、なんとなく面白さは感じていただけるんじゃないかなぁと思います。



なんか書き方が、わかっている人には怒られちゃいそうな感じですが。
興味もってくれる人がいるかもしれないってせっかくの機会でしたので。


Base Runsによる打撃評価法、のひとつ

なんか最近書くことがなくなってきてしまっているので、年末にやりたいと思っている総合評価改良に関して少し食い気味に。


Base Runsという得点推定式があります。
その式に特定のチーム打撃成績を代入するとこのくらいの得点を記録しているだろうという数字を弾き出してくれるRCやXRみたいなやつ。
Base Runsは実際の得点数によく対応しており、式の組成に論理性も感じられ、個人的には(シミュレーションモデルなどを除けば)現状最も優れた得点推定式ではないかなと思っています。
(詳しくはサイトのコレとかコレで)

となると、打者の打撃成績を得点で評価するのにBase Runsを使えないか、と考えるのが自然の流れです。
それにはいくつかの方法が考えられます(Base Runsはそのままでは打者個人には使えません)。
今採用しようと考えているのは、Base Runsを多くのコンポーネントをカバーするような式にした上で進塁効果をNPBにアジャストした後個々のイベントの加重をひねり出すというもの(あぁ、カタカナ多くなってダメだな)。
まずある年のリーグの平均打撃成績にBase Runsを適用します。それからそこに本塁打を1本足して計算し、差分をとります。
これをやる意味は、Relativityに基づきあるリーグの話はある程度あるリーグ内で完結していく必要があるというところにあります。例えば全体の出塁率が高いリーグと低いリーグでは打席あたりの期待走者数が違うのでXRのように一律に1.44を加重するということはちょっと変なわけです。
Base Runsを使うと(プラスワンメソッドとか呼ばれるものでしょうか)XRとかよりは多少柔軟に、一応そのリーグに合ったイベントの価値が出てくるよね、という話になります。
もちろんBase Runsの内部で使っている係数自体がMLB由来のものだったり固まった加重を取り出してしまうことはある種積算式の特性を殺すことだったりするわけですが、それらのことは大きな問題ではないと言ってよいと考えています。その辺はサイトを読んでいただければわかるかと。言ってしまえばXRの係数とかもそんなに問題だとは思っていないんですけどね。

特定のリーグの、じゃあないですが例として1992~2008のチーム打撃成績で以上の計算を行うと各打撃イベントの加重は以下のように出ます。

1B0.461
2B0.751
3B1.032
HR1.402
BB0.301
IBB0.174
HBP0.327
SB0.193
CS-0.282
SH0.111
Out-0.092
SO-0.013

これをXRのように加重して得点創出とし、アウト数をベースにバッティングランズを算出することができます。
細かくやっていけば、リーグそれぞれの打撃事情に合った加重のバッティングランズが得られる……と自己満足レベルでは考えられます。
まぁMLV(これも紹介したほうがいいか)のようなことをやるのもいいかなと思っていて、これは結局採用しないことになるかもしれませんが。
なんかこう、もやもやが残らずスッキリできるものがありそうでないんですよねぇ。



得点率・失点率

球団得点率失点率勝率ピタゴラスWIN+
ソフトバンク4.48 3.86 .594.574 1.4
日本ハム5.42 3.88 .571.661 -6.3
西 武5.20 4.60 .507.561 -4.0
ロッテ4.39 4.53 .464.484 -1.5
楽 天3.57 4.47 .451.389 4.3
オリックス4.02 5.45 .394.353 3.0
球団得点率失点率勝率ピタゴラスWIN+
巨 人4.24 3.40 .642.609 2.4
ヤクルト4.14 3.88 .574.532 2.8
中 日4.20 3.68 .556.566 -0.8
広 島3.39 3.94 .493.425 4.9
阪 神3.73 3.82 .426.489 -4.4
横 浜3.55 4.96 .338.339 0.0

※7/8時点

実際今各球団がどのくらい点取られて、点取ってるんだ?っていうのを見つつ、この前触れたピタゴラスについてもうちょっとはっきり書けばよかったなぁってことを思い出したので少々。

数字の得点率・失点率は得点・失点それぞれを(簡易的ですが)チーム投球回数で割って9倍したものです。勝率は実際の勝率とピタゴラス勝率。WIN+は「試合数×(勝率-ピタゴラス勝率)」、要するにピタゴラスに比べて実際の勝率で上積みしている勝利数を表しています。

で、ここでいうWIN+にあたる実際の勝率とピタゴラスの差について、この前は「運も大きい」というような書き方をしましたが、先進の米国セイバーメトリシャンはむしろ運が主なものとして見ているようです。とすると何が起こるかと言うと、日本では「監督の技量」だとか「効率良く勝つ能力」だとか賞賛の対象になるこの数字の上積みは「現状はチームの得点能力に比べて運良く多く勝っているので今後ピタゴラスの数字に向けて下がっていくだろう」というようなマイナスの判断材料になります。
もちろん運だけじゃあないということは改めて補足するまでもないと思うのですが、得点というカードと失点というカードがどう組み合わさっていくかはそうそう思い通りにならないということで。
結局、「基本的には運」と見たほうが実際わかりやすいのかなぁと個人的にも思います。


守備位置補正 試算

そういえば、守備指標だけじゃなくてフィールディングバイブルIIでビル・ジェイムズが解説していたような守備位置補正の日本版もやってみないとな、と考えていたんでした。
非常にデータの整理が面倒なんで避けてしまっていましたね。
何をやるかというと結局はmorithyさんの『総合評価の守備位置補正』と同じようなことで、「もう先輩がやってくれているんだからいいや」と言えなくもないのですが、まぁ自分で計算しないのは気持ち悪いし自分なりのやり方をしたい面もあるので。

そもそも私がサイトの総合評価で使用した守備貢献のベースラインは、アベレージのチームでも144試合で72勝分の貢献があり、そのうち半分くらいが攻撃と守りに分配され、さらに守りのうち何割かが(投手でない)守備に分配されることになるはずだ、という感じのものです。
各守備位置の平均的な選手がどれだけの貢献を得るかがわかれば、各守備位置での相対評価であるRRFなどに加算して全体の貢献を得ることができるはず、と。
問題は守備の貢献はどのくらいなのかとか、各守備位置への貢献の分配はどのようになるのかというところで、それについて具体的な方法論を与えたのがジェイムズの解説でした。
その内容は前述の通り結局打撃の補正とも言えてしまうと思うのですが、ひとつの仮定で割り切って具体的に行っているという点では美しいかな、と感じました。
で、一度ジェイムズのを参考にやってみたいかなと。


2008年セ・リーグの打撃成績を、各選手の出場イニング割合に応じて各守備位置に割り振って得た結果が以下。

守備位置長打率出塁率得点創出
捕手.351.303294
一塁手.470.362559
二塁手.349.322355
三塁手.440.336446
遊撃手.346.319334
左翼手.450.348538
中堅手.397.347446
右翼手.418.318451

ジェイムズ風の計算(要はよく打つ守備位置はその分マイナスする)を取り入れつつ、年間の守備全体の貢献が12勝として各守備位置に貢献を割り振ってみたものが以下。

捕手1.9
一塁手1.1
二塁手1.8
三塁手1.4
遊撃手1.8
左翼手1.2
中堅手1.4
右翼手1.5

一年分だけでは非常に心許ないので数年分やる必要があるだろうと思います。右翼手が中堅手より高いのとかたまたまでしょうし。
これで総合評価がもう少しスッキリするといいのですが……


試しに

前回触れた守備指標の話で、サイトでやっている外野手評価と同じようなメソッドを用いて刺殺なしで内野手を評価すると以下のような感じになります。
Plus Plays評価で、最初の数字が当方の評価、右の数字がRRF。

2008年セ・リーグ 遊撃手及び二塁手

梵 英心26 32
坂本 勇人7 13
鳥谷 敬6 48
小窪 哲也3 2
宮本 慎也3 -10
石川 雄洋-4 -6
川島 慶三-5 -9
デラロサ-6 -12
石井 琢朗-10 -6
井端 弘和-24 -40

東出 輝裕28 25
田中 浩康19 29
平野 恵一10 20
荒木 雅博-3 8
仁志 敏久-11 -1
関本 賢太郎-17 -35
木村 拓也-21 -38


これでも納得いかないことはないんですよねぇ。


そのうちやりたいこと

最近それほど時間がとれない中
セイバーメトリクスに関して「これを調べたり試行錯誤したい!」って思えるものがなんとなくないなぁと思いつつも(全てにおいて勉強が不足しているのはもちろんですが)
サイトの守備のページに、内野手について自分なりの指標を形としては出していないんだっけ、と思い出し。

いや、外野手の評価はやっていて、自分の中の首尾一貫性を保とうとするならそれの内野適用版をやるっていうだけの話ではあるんですけどね。投手のL/R偏向を補正する係数なんかは機械的に出るものだし。
確か内野手の守備評価に刺殺を含めるかどうかで迷っていたんでした。
Naranjaさんがご紹介されていたDRAの説明には、内野飛球はほぼ自動的に全部アウトになるものだからフライのキャッチによる刺殺はたまたま飛んできたかどうかで決まる(→守備能力とは関係ない)こととか、「ビル・ジェイムズは三塁手の刺殺数と守備能力の間に関連性がないことを発見した」とか書いてありませんでしたっけ。
かといって非常に守備の統計が貧弱な中せっかく刺殺という記録があるわけだから活用したいというのもあり。

とりあえず前の総合評価(Total Win)でやった守備評価は納得いっていないし、2009年シーズン終わったら全体的に改変したTotal Winを出したいと思っているんで
そのために、という意味でもなんとか考えないとなぁ。


 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。