Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

リプレイスメント・レベル


リプレイスメント・レベル概論

書きました。何故かちょっと力作。
というのもリプレイスメント・レベルの議論てあっちこっちに散らばってて
私のようにわりとこういうことに時間を使っているほうと思われる暇な人間でもなかなか核心的なキッパリとした説明を見つけられないわけでして。掴みにくくまとめにくい。
頭脳明晰なセイバーメトリシャン達にとってもこれってそんなに扱いにくい問題なんだろうか。
そういうわけでいつもに比べても文字数はあるのでお時間のあるときにどうぞ。

ネット上は色々と散策しましたが重要なものを見落としているかもしれませんし
米国の出版物に関してはそれこそBBTNぐらいしか押さえていないので、お前の説明は重要な部分を欠いてる(or間違えてる)ぞというのがあって優しく指摘して下さる気概のある方がおられましたらよろしくお願いしたいです。

それにしても、本当にこれでも「入り口」ですねぇ。課題が山積。

スポンサーサイト

非常に有意義

所詮はただの野球好きのブログ。セイバーメトリクスなんて特に高尚なものだとは思っていない。
セ開幕戦を見て思ったことは色々ある……それはさておき



Naranja氏が個人の力で同種のデータを出されたときも、ひたすら「すげーすげー」と言って注目していたものですが
今回データスタジアム社のブログに非常に興味深いデータが示されています。

Batted Ball Pitching Stats (プロ野球 データスタジアム)

チーム単位での投手のバッテッド・ボール・スタッツ、要はゴロを打たれた割合がどのくらいかとか、フライはどうかとか。
これはチームの投手の性質を鮮やかに映し出すだけでなく、ゴロと外野フライそれぞれがどれだけの割合でアウトになったかなども示されているため、内野手・外野手それぞれの守備力を表す守備スタッツとして扱えます。
これらのデータは米国の先端のWebサイトであるTHTやFanGraphsでもまともに論じられるレベルのものです。

そして、個人的に最も注目したいのが記事中盤にあるNPBの打撃イベント別Run Value
単打や二塁打などだけでなくゴロやフライなどの打球種別にも算出されています。
これらは日本版Batting RunsやDIPS等、非常に幅広い応用範囲を持つ基礎データになりますね。

サイトなど見てもらっている人にはなんとなくわかると思うんですけど、私個人はXRやRCをあまり使いたくないほうでして、基本的には多くのことを得点期待値(LWTS)ベースで考えます。
それで、予想通りではありますがNPBでもLWTSがMLBにかなり近くなるということが色々な面からわかって安心しています。
セイバーメトリクスに馴染みのない人には意味がわからないかなぁとは思いますが、それにしても素晴らしい記事ですよ。

(ところで、データスタジアムの方とかTwitterやられているのは拝見しているんですけど、個人的には流行りについていくのが遅いのか、どう楽しめばいいのかわからずアカウントも持っていません。「DERを用いて守備力が変化したときの対戦打席数増減を投手の投球数負担に換算なう」とか書いて何か楽しいことが起こるのでしょうか)

一軍と二軍の壁

一軍と二軍の壁

サイト更新、一軍と二軍のレベルの差に関する話です。

詳しい人なら「ああ、それならリプレイスメント・レベルの議論に関わってくるね」と思われるかもしれません。
実際その通りで、これは直接リプレイスメント・レベルに対するものではありませんが
こういうこともやりつつ最近色々勉強してやっとこさ向こうのセイバーメトリシャンたちが話していることの概要がわかってきた感じなのです。

生意気ながら今までリプレイスメント・レベルの議論って「なんか誤魔化してない?」って思いがどうしても拭えなかったんですけど
最近許せるようになってきたんですよ。
で、今後の議論をやりすくする意味でも自分が知る限りのことと私見を「リプレイスメント・レベル概論」的にまとめてみようと思い、かなり書けたんですが、これがなんだかオオゴト(文字の量が1万2千字くらい)になってきてしまい意味もなく疲れてます。なんかもう「概」論じゃないし。
下手な訳語を当てるのが怖いからカタカナのままにしておくべきか、「リプレイスメント・レベル」じゃ長いし日本のファンにはわかりにくいから「代替水準」とでもしておくべきか、とかも微妙なところです。

RF関連のつぶやき

セイバーメトリクスに関連する用語で検索したりして勉強をしていると、さまざまな言説を目にすることができます。
その中で守備指標に関して時々気になるなぁと思うことがあるので、自分なりの見解を書いておきたいと思います。
他の方の活動を否定するものではなくて、自分の捉え方ですので、悪しからず。




・RFは遊撃手と外野手(特に中堅手)以外はアテにならない

これはこちらのコラムなどで見ることができる意見でwikipediaなんかにも引用されていますが、私はそうは思いません。
単純に自分で打球を処理する以外のコンビネーションのプレーが多くなると(内野手であれば基本的には補殺に対して刺殺が多くなると)守備力の評価としてはノイズが入りがちになると思われます。
これは一塁手と二塁手なんかに見られる状況であり、たしかに相対的には信頼度は下がると考えられるかもしれませんが
元々対象にとることを想定されていない一塁手は別として、三塁はこの意味ではむしろ遊撃よりも信頼度が高いと考えられますし、二塁もやや低いにしても遊撃の場合と比べて急に使えなくなるとは思いません。
コンバートの互換性などを見てもそこまで異なる質のプレーが行われるわけではないでしょう。実際、信頼度が高い守備指標とされるUZRと各守備位置のRFの相関では、三塁手は遊撃手より強く結びついています(FanGraphsから直近3年分のQualifiedリスト使用)し、二塁はやや低いですが遊撃は良くて二塁はダメと結論できるようなものではありません。外野では中堅よりも両翼のほうが高い相関となっています。
年度ごとの再現性も、ここから少し推し量れると思います。
NPBとMLBは違いますがNPBのデータからも特段遊撃手と中堅手以外アテにならないことを示すデータは私は得ていません。補正をしてサンプル数を確保していくとすれば、投手と捕手以外についてはそう格差はなく参考になるレンジの指標が得られるのではないかと思います。Hardball Timesなどにこの手の研究は結構あります。



・RRFはタイロン・ウッズの評価が高くなるような指標だから信頼できない

別に通常なら気にするレベルにない言説なんですが
これってなんか私のサイトのせいな気がするんで……。
前述の内容ともちょっと関連してきますが、この種の言説には主に3つの疑問があります。

a.選手のデータを恣意的に切り取っていること
別に私のサイトとは関係ないのかもしれませんが、当方のサイトに掲載している限りとしてウッズのRRFが良いのは2008年だけであって他は全てマイナス。長期的スパンで見ればRRFがウッズの守備を高く評価しているという事実の認識自体正しいとは言えません。で、サンプル数に注意が必要なことは例えばページ内に書いています。
>偶然の打球分布の影響などを考えるとRRFでそもそもの対象になっている遊撃手ですらフルイニング出場でも1年では足りませんし、プレーの絶対数が少ない一塁手や三塁手は尚更の話です。できれば数年の推移を見守りたいところ。

b.少数のサンプル、特定の守備位置で全体を語ろうとしていること
ウッズのサンプルというのはRRFの対象となる守備者のほんの一部にすぎず、またRRFはそもそもは遊撃手用の式であって、一塁手は補殺のみを対象として出されていて対象となるプレー数が少ないことも合わせて他の守備位置の数字に比べて信頼度が低いと言えます(このことも前から書いています)。
ですから、仮にRRFによるウッズの評価が間違っているとしても他の守備者、他の守備位置のRRF評価がどうかはわからないということです。

c.そもそもウッズの数値が高かったらRRFが信頼できなくなる理由の論証がないこと
例えば2008年のウッズは実際に頑張っており、イメージの側が間違っている可能性です。まぁウッズの場合についてはそんなわけないと言っちゃってもいいような気はしますが、これはRFが評価されるときにいつもつきまとう問題です。

このようなネタが流通する元々の意図としてあるいは「象徴的な例としてウッズの数字があり、他にも色々おかしい」ということがあるかもしれませんが
繰り返しますがウッズの数字の認識自体どうなんだろうと思いますし、個人的にはRRFはサンプル数が確保できれば多少の参考にはなる指標だと考えています(このことについてはこの前コラムに書いたばかり)。
ウッズ云々はまともに押している論者がいるわけではなくて私がたまたま見つけたものに過敏に反応しているだけだと思います。とはいえ守備指標への批判って結構この「型」に沿ったものがあるわけで。

守備は数字で評価できないと思っている人に無理に指標を売り込もうという気は私にはありません。
ただ中立的でこういう議論にいくらかの興味を持ってくれる人が一方の意見だけを見て「あら、そうなの」と思ってしまうと何かもったいないような気がするので、もう一方の意見もあることを事実として書いておきたいと思うわけです。


なにか他にも書こうと思っていましたが疲れたのでこの辺で……。

2010開幕

気分変えたくてブログのテンプレート変えました。というか、カスタマイズして作りました。
またこういうことをやり始めるとハマって時間食ってしまうからやめておいたほうがいいんだろうなぁと思いつつ、始めてしまって案の定時間食いました。
しかも出来上がったのが大して変化のない、シンプル好きをこじらせたような灰色トーン。……デザイン崩れてたりしたらご指摘いただけると有り難いです。
前々からもっとカテゴリーとか意味がある感じで活かしたいなぁと思っていたり、ブログ開始当初の記事の方は過去記事管理の操作で変なことになって消えてたりで、何かバランス悪いのでいっそのこと新しいブログをゼロから始めようかとも思ったのですが、訪れて下さった方にいただいたコメントとかも含めて財産なのでまぁ継続は継続で。


そうこうしているうちに開幕しちゃってる。
楽天はほんとに聖澤が1番中堅なんですね。個人的にも期待かけてます。
守備指標を見ると外野守備は特に「なんだかんだで脚力がモノをいう」ように思われますから、鉄平と聖澤の二人が堅めるのは強そう。

週刊東洋経済と日経ビジネスアソシエ

今発売中の「週刊東洋経済」と「日経ビジネスアソシエ」というビジネス誌ふたつに少しずつですがセイバーメトリクスのことが載っていますね。週刊東洋経済のほうは東海大の先生によるWPAの紹介、日経ビジネスアソシエのほうはデータスタジアムの専門家によるラミレス・ガイエルの比較や盗塁の分析。

紙面の都合上十分な説明ができないのはご愛嬌として、どちらも面白いです(ラミレスとガイエルを選ぶとは、うまいですよねぇ)。今、日経のほうを読んだところですが、特集全体も非常に良いので「買い」ですね、これは。

それにしてもこんなこと(サイトやブログ)をやっている自分が言うのも変なのかもしれませんがこのまま真っ当にセイバーメトリクスが普及してもそれはそれでなんだか面白くないような……w

横浜 11K+ミス+淡泊攻撃でまだ勝利なし

横浜 11K+ミス+淡泊攻撃でまだ勝利なし

【横浜0−0日本ハム】横浜がまた勝てなかった。オープン戦7試合を消化して12球団唯一未勝利だ。

 「未勝利?試合だから仕方ない」と振り返った尾花新監督だが、勝てるチャンスはあった。0―0の6回の攻撃は四死球で無死一、二塁も9番・大西が3球連続バント失敗して三振。続く野中もバント失敗後に見逃し三振。早川も中飛で好機をつぶしたとあって指揮官は「終盤にきっちり送るところを決めてくれないと」と苦い表情だ。

2010/3/12 7:01 配信 スポーツニッポン


昨日の試合ですが、ハマスタに観に行ってきました。
なんというか横浜ファンの溜め息ばっかり印象に残る感じが……w
期待の橋本でのバッテリーエラー(暴投)、野中の盗塁死・牽制死、カスティーヨの失策、内川の併殺打、大西のスリーバント失敗……
まぁ、うまく言えないけど、頑張って欲しい。
素人の愚かな意見を言うとすれば、筒香は、なんとなくナメてましたし実際良いところで回ってきて打てませんでしたが見た感じ結構雰囲気がありますね。
しかしまぁ日ハムは出てくる投手出てくる投手クセがあって面白いわ。

なかなか難しい

「旧来の指標とセイバーメトリクス」……もっとこういうのを書くべきだと思っている「そもそも」的な話をサイトに追加。
表現が難しいため、こういう言い方を好まない人もいるだろうなぁと思いつつ、でもまぁこんなもんで、と、例によって言い訳しつつ。


長打力と得点の分布

このブログで以前打線シミュレータについてなんやかんややっていたとき、得点力を出塁よりも長打力に依っている打線は
同じ得点率でも試合ごとの得点の分散が出塁寄りの打線よりも少なくなる傾向があるようだ、ということを発見しました。
しかしそのことを論じてくれている人を他に見つけられなかったので自分の説に関して「これ結局どうなん?」と若干疑心暗鬼だったんですが
米国のどこかのプロフェッサーが同じことを言っているのがTangotigerのブログに取り上げられています。

Consistency is better than inconsistency?

このWhisnant教授の主張は、得点の分布のまとまった打線のほうが多く勝てて(これは並の水準のチームであれば当然です)、かつ長打率の高いチームが得点の分布の幅が狭まる傾向があり、結果同じ得点率なら長打率が高いほうがいいというもの。私が導いたのとまさしく同じようなことを言ってくれているわけですね。
そしてWhisnantはそのことを利用して、得点率から勝率を予想するピタゴラス勝率式に長打率を組み入れ、新たな式を開発しています。この辺り、さすがに頭の良い人は違います。
定式化しているので長打率の向上による分布の変化の影響がどのくらいかということも具体的にわかるはずです。記事には長打率.080の向上で1勝、シーズンで2勝になる可能性もあると書かれているようですが……まぁ、詳しい式のことはちょっと検証しきれてません。

で、これを紹介しているTangotigerは分散が小さいと勝率に良い影響があるのは肯定しながらも
出塁率に比して長打率が高いと分散が小さくなるというのは逆なんじゃないか、と言っています。
ただし記事中のその意見は証明されたものではなく、やっぱりこれはWhisnantが正しいだろうと思います。自分なりの見解は以前説明した通り(http://bbalone.blog119.fc2.com/blog-entry-197.html)です(今見るとデータの扱いとか含めてかなり粗いですが……)。
コメント欄の議論を見るとTangotigerも意見を変えた様子。

ちなみに式が正しいとして、その有用性に関しては正直なところ懐疑的ですが、定式化してみて「こういう要素があるが、これだけしか影響はないのでさほど注目する意味はないことがわかった」のであればそれはそれで研究としての価値はあるかと。
まぁ今後どう注目されるかはわかりませんけれども。

Zone and Range


ゾーンシステムとレンジシステム

わりと暇はあって色々書いてはいるんですが……現在溜まっている複数のネタをちゃんと完成させて世に送り出せるかどうか。
まぁ気楽にやりますので気楽に読んで下さい。


 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。