Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

セイバーメトリクス本質観としてのピタゴラス

Twitterでも書きましたが日経BPnetに掲載されている岡田さん(セイバーメトリクス・リポート編著者)の書かれた記事がオススメなので紹介しておきます。

メジャーリーグを変えたセイバーメトリクス入門(前編) (日経BP)

私が評するのもおこがましいですが、わかりやすいセイバーメトリクス概説でありながら本質を突いていて読みごたえがあります。

特に好きなのは、個人的な好みかもしれないですが、ピタゴラス勝率をドーンと提示して野球の構造をモデル化する観点を強調している点です。

色んな意味で奇遇ですが、最近読んだ小島寛之さんの『数学入門』でも数学史上最大の発見としてまず「ピタゴラスの定理」が提示されています。教科書的に高校数学を勉強していると「こんなもん何に使うんだ?」と思ってしまいますが、よくよく考えてみるとピタゴラスの定理が行っているような空間と数量を関係付けたりそこから算術を利用して新たな発見をしたりということは実は全く当たり前のことではなく、そのような発想を基礎付けたことそのものが偉大だというわけです。

さらに小島さんは別の著作『数学でつまずくのはなぜか』の中で心理学の「アフォーダンス」の概念にインスパイアされた面白い数学観を記述しています。
それは数学をとらえる本質観のひとつとして人間が主体的な能力として数学的な思考を持つというよりも世界の側に「数理的に記述できる」という性質があって人間がそれを(固有の仕方で)引き出しているのだという見方です。

私はもちろん数学やアフォーダンスの理論の深いところはわかりませんが、数学やセイバーメトリクスを単なる小手先の道具として見るのではなくその深い性質に信憑をおく見方には惹かれるところがあります。

凝り固まった野球観や野球についての全能感がまずあってそれを表面的に補強するために数字を使うだけでは数字の威力は全く活かせないでしょう。そうではなく野球を数理的に見るという新たな視点により本質を捉え直す構えが重要だと思うのです。野球の世界についても数理的に記述できるという性質があって、こちらがそれを上手く引き出してやることで有益な分析手法が生まれたり新たな発見が生まれたりするものではないかと思います。

話は紹介の記事に戻りますが、ビル・ジェイムズのピタゴラス勝率は勝利と得点・失点という野球のすごく重要なところについて「世界と数字を関連付けてモデル化する」という仕事をして見せた点で数学におけるピタゴラスの定理のように意義のあるもので、その考え方を(物事に向かう構えとして)受け入れることはセイバーメトリクスの深い部分を学ぶことに通じるように感じます。式は単なる数字ではなくて考え方です。

話としては少し大袈裟になってしまったかもしれないですが、なにより発想の転換なしにWHIPだのOPSだのと指標の計算式をなんとなく覚えるだけというのでは楽しくもないと思いますし。

スポンサーサイト

The Marcels

サイトや書籍で成績予測を出している私ですが、今日また急に成績予測(プロジェクション)システムを研究したい熱が湧いてきて、改めてMarcelの勉強などをしておりました。

MarcelというのはセイバーメトリシャンのTangotigerが開発した成績予測システムです。
MLB好きであればご存知の方も多いかとは思いますが、日本ではほぼ聞く機会がないのでその予測が公開されいているページをリファレンスとして載せておきます。

http://www.tangotiger.net/marcel/

Marcelの算出法、Tangotiger自身による解説は以下です。

http://www.tangotiger.net/archives/stud0346.shtml

あるいは、ほかの人による平易な説明も。

http://triplesalley.wordpress.com/2010/12/22/marcel-and-forecasting-systems/

貴重な日本語でのMarcel言及記事。

阿部離脱の影響


Marcelは簡単に言うと、選手の過去3年の成績を、新しい成績ほど比重が大きくなるように重みづけして合計し、平均への回帰と年齢の変化についての補正を加えたものです。

これは統計学と堅く考えなくても、選手の成績を予測するなら「過去の成績がある程度は継続するだろうし、それにおいては最近の成績ほど将来との関係は強いだろう。また極端な成績はある程度振りもどされるようだし、年齢というのも客観的に明らかな要素として考慮する必要がある」といったふうに考えるのはかなり自然で、これをそのまま計算式に落としたものとも言えます。なので考え自体は全く難しいものではありません。

米国には多くのプロジェクションがある中でTangotigerがMarcelを開発したのは、数あるプロジェクションシステムの基準として、考えられる最小限の要件でプロジェクションシステムを構築した場合にどういう結果が得られるのかを出すという意図に基づいています(このためMarcelは、サルでもできる成績予測という異名があります。というかMarcelという名前がサル由来らしい)。

従って例えばFanGraphsでMarcelを見て結果が外れていても「Tangotigerによる予測」の精度が低いと考えるのはお門違いだったりします。MarcelはTangotigerが持ちうる限りの知性を使って正確な予測をしようと構築したものではなく、できるだけシンプルにと作ったシステムですから。実際、他の多数のプロジェクションシステムに比べてMarcelは非常にシンプルです。

そうするとやはりMarcelの精度は低いのか? というと意外とそうでもなくて、Marcelはもっと複雑な手法を駆使したプロジェクションシステムを負かしてしまうこともあります(シーズンが終われば各システムがどのくらいの誤差だったかは確認でき比較できます)。
このあたりはやはりシンプルでもロジックのポイントをおさえれば的確な議論ができるということなのでしょう。世に言う80:20の法則のように、80%の精度は20%の要素で出せるけれども、これを90%にしようと思うと複雑さは2倍3倍と飛躍的に増大していく形なのかもしれません。

そんなこんなでプロジェクションとしてはとりあえずMarcelを知ることは有益で、議論としても面白いです。

しかし改めて、勉強しようと思ってもほぼ英語の情報しかないというのはハードルを感じますね。私も物凄く面白いが故に気合で読んではいますが、別に英語に強いわけではないですし。この辺考えるところもありますが、できれば徐々に紹介・議論はしていきたいと思います。
(ちなみに……Marcelの結果的な計算方法はシンプルですが、それを構築する過程での議論にはかなり難解な部分もあります。そのことを面白がって「(サルっていうけど)とんでもねぇサルだな」なんてツッコミが入ったり。そういう議論を見るのも面白いところです)

日本でもMarcelの結果(NPBについての)くらい計算して公表されてもいいと思うんですけどね。これ言っちゃうとやっぱり自分でやることになるのかな……。



 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。