Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

プロ野球勝敗予想バトル

プロ野球勝敗予想バトル

公式にこういうことをやるのかぁ、面白いなぁ、と思う反面
「日毎にこの日勝つと思う球団を選び、クリックして下さい」
という説明を読んで、あぁ、やっぱり日毎なのかとガックリきてしまうセイバー気質な自分。
1試合の結果なんて運の影響が大きすぎて「当てたい」とか「当たったら嬉しいだろうな」と思う次元にいかない。
先発投手の関係とか、1試合だけだからこそ予想しやすい面もあるし、1試合の予想を繰り返す上で精度を高める何らかの合理的な手法といったものも確実に存在するでしょうが
個人的にはあんまりやる気にならないかなぁ。
自分のことを除けば短期的にやれる予想ゲームっていうのはいいんじゃないかと思いますが。

むしろこのゲームをやり続けて「名人」の予想的中の継続性なんか測って悪い意味で期待を裏切る結果だったら面白いとか考えちゃうのはひねくれてますかね。


コメント

どうも、ご無沙汰してます。

わたしはセイバー系の指標の中で一番信用ならんと思っているのがピタゴラス勝率でして(笑)。
これって、統計的に裏打ちされた理論モデルがあるのでしょうか? それとも単に近似値として有効だから使われているのか、どちらなんでしょう。

話題に乗り遅れたみたいなので、こちらに書きました。すみません。

こちらでも全然大丈夫です。またお越し下さりありがとうございます。

ピタゴラス勝率の理論的な裏づけというのは、私は知りません。
英語サイトなんかには改良版の提案などを伴いつつピタゴラスが勝率の見積もりとして妥当に機能することのかなりマトモな検証がたくさんあるんですが、どれも「実証的な」研究のように見えるので
感じとしてはどちらかといえば「近似値として有効だから使われている」んじゃないでしょうかねぇ。

もちろん
失点より得点が多いほうが勝利の割合は多いはずだとか
得点と失点がイーブンなら分布が偏らなければ勝率5割だろうとか
得点がゼロなら勝率もゼロだろうとか
野球のルールにおいて当然なことがピタゴラスの式には明確に表れているので、「理論的な式じゃないか」みたいな言い方もできないことはないんでしょうけど。
二乗とかっていうのは経験則的なものではないかと思います。ビル・ジェイムズ当人が1.83がより良いって改めたりしているようですし。
私は「総得点と総失点からの通常あるべき勝率」という意味においては、ある程度信用してますよw

やはりそうでしたか。係数を2にしてあるのは多分計算しやすいからなんでしょうね。

試しに今シーズンの成績をExcelで最小二乗法を用いて最適な係数を調べてみたんですが、12球団合算では1.54でした。
ところがセ・リーグ単独では1.94、パ・リーグ単独なら1.13です。こんなに係数がブレるのはちょっとまずくないですか?

何より「本来あるべき勝率」という考え方はあまり好きじゃないですね。1-0でも10-0でも一勝の価値は同じはずですし、乱暴すぎる議論だと思います。

まあ、一試合平均得失点からポアソン分布を使って・・・とかやるよりは簡便ですが。

あるべき、は言葉が微妙かもしれませんが。
「この総得点と総失点だったら通常の分布ではこのくらいの勝率になるようだ」と言い換えても同じことで、ただそれだけの話だと思います。
価値判断を含むわけじゃないんで、そこでは問題が発生する余地もないかなと。

得点が多ければ勝てるはずだ、ってなんとなく言うだけなのか
法則にすると大体こんな感じらしい、ってことを具体的に示すかの違いですからね。
統計解析における一般法則(普遍)と個別とかそういう話だとすれば
一般的な法則として記述しようとすれば個別と合致はしない仮想のものとなりますが傾向としては合うしそれを知っておくことが有用になる場面はあるだろう、ということで
その意味ではXRなどどれも同じはずです。

どうも総得点と総失点から勝率を見積もることに関しての精度(確からしさ?)はピタゴラスのそれがかなり上限に近いようなので
係数関連の話については個人的にはあまり問題にする気がしないです。
ビル・ジェイムズ以外のセイバーメトリシャンが開発した計算モデルもありますが係数を可変にした改変ピタゴラスでほぼ等しい結果が得られるようですし。

うーん、私は細かい数字を問題にしているわけではないんです。

何事も自分で検証しないと気が済まない性質なので、セイバーメトリシャンの言ったことだとしても、そのまま鵜呑みにはしません。クロスケさんも「これはそんなに考慮する程のものではない」という指標が他にあったりするのではないでしょうか?
私にはピタゴラス勝率が示す数字があまり意味のあるものとは思えないということで。

なにか理論的な裏づけが? と訊いたのはそのためで、これって求められたから適当にデータをバッサリ切って見せただけで、おおまかな得点効率はわかってもそれ以上のものじゃないという気がするんですよね。

世間では使われているけれども自分にはどうでも良い指標、ていうのは色々ありますね。
そもそもセイバーメトリクスを知った当初は興味深いと思いながらも結構否定的に見ていて、そこから自分の否定を否定するうちにハマっちゃったクチですからw

えーと、大体上で書いちゃったんで繰り返しなんですけど
私はピタゴラス勝率は得失点と勝率の一般的な法則として捉えるに足る確からしさを持っていると思いますしピタゴラス勝率が示す数字は使い道があると思います。
RC等との組み合わせで、どういう補強がどのくらい効果的なのかとか、どの選手がどのくらい貢献しているのかとかを知るものさしになりますから。
で、もちろん用途によってはおおまかな式でしかない、とも思います。
ピタゴラス勝率を特定のチームデータに当てはめて「このチームはこのくらいの勝率を上げるべきだ」なんて話をするんだったら私もあまり意味ないと感じますよ。そういう使い方もありますけど。

最近サイトのほうにも書いたばかりですが指標の有用性を語るには用途を設定して考えないとぼやけますね。どうも怠けてしまうので、すみません。

>どういう補強がどのくらい効果的なのかとか、どの選手がどのくらい貢献しているのかとかを知るものさしになりますから。

ああ、なるほど。納得しました。
ざっとこれくらいの効果が有るって示すのには、やはり便利ですね。

これが実際の勝率と比べて監督の采配が云々とかいう話だったらとてもついていけない(笑)。

一口にセイバーメトリクスといっても考え方は人によって多種多様で、その指標が持つ意味を横に置いて数字だけが一人歩きすると話が変な方向へ行ってしまうのは、私も気をつけないといけませんね。
でも、メディアで取り上げられるときには大体こういう話になっちゃってるんですが。うーむ。

ええ、仰るような数字の一人歩きっていうのは最大の懸念材料のひとつでしょうね。
セイバーメトリクスっていうと複雑な数字を扱うというイメージで捉えられることも多いみたいですけど
数字そのものは検証の概念が具体的に表れたものにすぎなくて、大事なのは考え方のほうですから、それを忘れないようにしたいものです。

私自身余計な摩擦を起こしたくないんで書いてしまいますが、いちいち「数字で全てを表せるわけじゃない」とか「セイバーメトリクスは完全ではない」とか断りがついたりする時点で本当はなんか変なんですよ。

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://bbalone.blog119.fc2.com/tb.php/345-e0e35f3e

 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。