Baseball Concrete Blog

主にプロ野球について、セイバーメトリクス的な考えを交えながら好きなことを書いています。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

2011年度成績予測


2011年度成績予測

Baseball Labで華やかに三宅さんの予測が出揃った影で……。
算出方法はいちいち見ていくと面倒なので、基本的な考え方のところだけ見ていただければ十分かもしれません。
まだまだ未熟で、今後進化させていければ面白いと考えております。



スポンサーサイト

打撃指標wOBAとは


打撃指標wOBA (Baseball Lab)

個人的に現代セイバーメトリクス三種の神器のひとつだと思っているwOBAの紹介を書きました。
三種の神器の残りふたつはFIPとUZRです。
本質的には、この3つさえあればWARが計算できます。
これらはTangotigerとMGLが開発したものですが、そのさらに元にはBill James(守備の加点評価ほか)、George Lindsey・Pete Palmer(LWTS)、Voros McCracken(DIPS)等の巨人がいるわけですね。


私がwOBAに対して持っている不満は、「wOBA」という字面は日本人にとってなんだかなぁ……というところです。
しかし

・「Weighted On Base Average」という言葉は指標の意味内容を適切に表している
・日本語の呼び方を考えるにしてもおそらく漢字で4文字とか5文字になりそれはそれで煩わしい
・開発者がつけた名前を勝手に変えるのは失礼

といったことを考えると、「こちらはこちらで呼び方考えましょう」というわけにもなかなかいかない。
とはいえ、なんだか、ねぇ。
ちなみに「wOBA」の発音はコレです(YouTubeリンク・音量注意)。


書籍:『日本ハムに学ぶ 勝てる組織づくりの教科書』

画像:勝てる組織づくりの教科書


ビジネスにも通じる! 低予算でも「負けないチーム」はできる
ダルビッシュが抜けても、ファイターズは弱くならない!
なぜドラフト1位が「斎藤佑樹」だったのか。セイバーメトリクスが解き明かす最強の方程式

ダルビッシュの移籍が取りざたされています。日本ハムにとって、ダルビッシュが移籍せずに引退までチームに残ってくれることは理想です。しかし、高額な年俸との兼ね合いから、日本ハムから移籍しなければならないケースも現実味を増しています。そんな中、2010年オフに国内FA権を取得した田中賢介とは、2億5000万円+出来高払いの3年契約という好条件で真っ先に契約を結びました。
上位を維持するためのカギとなる選手として、高い守備力を持つ田中を非常に重要視していることが、はっきり伝わってくる契約でした。
日本ハムの動向を追っていると、日本のプロ野球がこれからも面白くあり続けるためのヒントが数多く得られます。

(講談社BOOK倶楽部より)




SMR Baseball Labの主催でもあるデータスタジアム株式会社の岡田友輔さんの著作。
セイバーメトリクスを用いてプロ野球の戦略的なチーム編成についての考察を展開している一冊です。
指標の計算法など技術的な話に終始するのではなくあくまで野球を戦略的に考えるという観点が一貫しており、ひとつの目玉となっている「日本ハムの強さの謎の解明」などがこれまでにない視点で語られていて面白いです。

これまで巷で流れてきたある種中途半端なセイバーメトリクスの話では、納得できない人も多かったと思います。
「セイバーメトリクスといえばまずはOPS。投手はWHIP、あるいはDIPS。ちなみにOPSにはGPAという改良版があって……」などといきなり言われても、その数字の持つ意義はよくわからず「色々ややこしい数字を計算して、だから何なんだ」と思ってしまうでしょう。
しかしその点本書では、あくまでも目的はチームを強くすることであり、統計データを用いた分析は現状を定量的に把握し問題点をあぶりだして最終的に合理的な解決策を導き出すための手段(ツール)であるということがよく伝わる構成になっています。

BABIPなど深入りすると面倒になる問題は少し避けているようにも感じますが使用されている数値について説明はされていますし、全ての解析の基本・度量衡となり得る得点期待値について説明の分量を割いている点は好感が持てます。
また、DERのイメージ図(p.50)や失点要因の分解図(p.139)などは優れもので、算出の方法を厳密に把握はしなくても解析の中身がわかるようになっています。

これまで断片的にしか伝わらないことの多かったセイバーメトリクスの知見についてその足りない部分を埋めて意義を伝える一冊だと思いますし、本書で提示されている各チームの戦力のポイントや課題などについても納得できる点は多いです。
考え方自体は普遍的ですが基本的に2010オフ現在のデータを対象として議論が展開されておりますので興味がおありの方は機を逃さないうちに読まれることをオススメします。

ちなみに……帯には「ビジネスにも通じる!」と書かれていますが本文には直接にビジネスに絡めた記述はありません(その意味では純粋な野球ファンが安心して購入できます)。
とはいえ実際にセイバーメトリクスの考え方全般は広く利用価値のあるものだと思います。何らかの方法で事象を定量的に測定・可視化して、単位を変換するなどして様々に比較を行い、問題点を具体的に把握し、有効性をシミュレーションしつつ解決策を出していく。これはあらゆる場面で通用するやり方でしょう。
私は自分の責任でビジネスをやったことなどありませんので偉そうなことは言えませんが、経営学専攻であり、大学に入った当初「なんでもいいから好きなことについてプレゼンしろ」と言われたときに真っ先に『マネー・ボール』についてプレゼンをした思い出があります。そのとき教授は「これは経営学そのものだよな」と言っていたので、まぁ強引に言うととりあえずそういうことでよろしいのではないかと思います。
「セイバーメトリクス経営学」とか「もし中小企業の管理職がマイケル・ルイスの『マネー・ボール』を読んだら」とか今ならリアルにあり得そうですね。余談でした。


目次

第1章 パ・リーグを面白くした日本ハム
第2章 セ・リーグは巨人、パ・リーグは西武
第3章 得失点換算で見えてくる真のチーム力
第4章 こうすればセ・リーグは混戦になる!




書籍:『9回裏無死1塁でバントはするな』

画像:9回裏無死1塁でバントはするな


まことしやかな「セオリー」は、本当に正しいか?
野球中継を見ていると、「9回裏ノーアウト・ランナー1塁、ここは手堅く送りバントでしょう」といった解説をよく聞く。
だが、統計学的な観点からは、送りバントは明らかに損な作戦である。
アナウンサーや解説者が、まことしやかに述べる「野球のセオリー」。しかし、それらの戦術やプレーには、果たして合理的な理由があるのだろうか。
こうした疑問に、統計学的な観点から答えようとするのが、本書で紹介する「セイバーメトリクス(野球統計学)」である。
従来の「勘」や「感覚」に支えられた常識を覆す意外な「真実」が、データから見えてくる。




発売直後に拝読していたのですが紹介が延び延びになってしまっていました。

本書はSMR Baseball Labにも寄稿している統計学者の鳥越規央さんが書かれた、セイバーメトリクスで「野球のセオリー」を検証するという内容の新書本です。
統計学者による著作といっても、「解説者の言説は果たして正しいのか?」という構えで野球ファンにとって馴染み深いさまざまなトピックが取り上げられており、また内容も難しい数式などはほぼ登場せず読みやすいものとなっています。
手が止まらずにサクサクと楽しめます。

個人的には取り上げられているトピックが多岐にわたり、また興味を惹くものが多いことが印象的でした。
書かれている解答を楽しむことができるのはもちろんのこと、ひとつの主題でも切り口は多数あり得ますし関連する事柄にも広がっていくため読者の側が自ら野球を考えていくためにも参考となり示唆を与えるものだと思います。

私のようなセイバーメトリクスジャンキー(?)にとってはライトすぎるように感じるのは事実ですし、書かれている解析やセイバーメトリクスの知見に関する記述に100%同意するものではありませんが(生意気ですみません)、複雑な内容を紙媒体におさめることの難しさもひとつにはあると思います。価格もリーズナブルですし、わかりやすく楽しめる点には工夫されていると感じました。
特に「第5章 あの名場面は統計学的に正しかったか?」で、かの日本シリーズ山井交代劇、江夏の21球などを取り上げているのは面白いです。
勝利確率を利用したその分析はよく「WPA is a story stat」と言われるその性質を見事に活用して、野球におけるドラマを数字で描写しています。

本書のトピックの多様さを知るには目次を見るのが有用だと思いますので、Amazonから引用して共有しておきます。



序章 野球のセオリーは本当か?――セイバーメトリクスで見えてくる「真実」
 データが覆した常識
 セイバーメトリクスはどのように活用されているか

第1章 9回裏無死1塁でバントをしてはいけない――攻撃編
1 1点差の9回裏ノーアウト1塁でバントをすべきか
 アウト1つの重みを考える/犠牲バントが有効なシチュエーションはあるか
2 「左打者には左投手」は本当に有効か
 左打者は本当に左投手が苦手?/中日落合監督の眼力
3 「バッティングカウント」はあるか?
4 たたきつけるバッティングはヒットを生みやすいか
5 「打点」では選手の得点能力は測れない
 得点能力との相関性が高い指標「OPS」/打撃以外の能力を反映させた「RC」と「XR」

第2章 失点は誰の責任か――守備編
1 先頭打者に四死球はヒットより悪いか?
2 2ストライク・ノーボールで本当に1球外すべきか
3 敬遠して次のバッターと勝負は良い作戦といえるか
4 エースにエースをぶつけるのは得策か
5 「失点」における投手の責任はどこまでか?――「防御率」の限界
 投手個人の能力を測る「DIPS」/出塁を許さない度合いを示す「WHIP」
6 「ゴールデングラブ賞」は本当に守備能力を評価しているか
 失点を減らす守備とは――「RF」/守備範囲をどれだけ処理できたか――「ZR」

第3章 日本とアメリカとの「常識」の違い
1 メジャーでヒットエンドランをしないのはなぜか
 「玉砕戦法」のヒットエンドラン/ヒットエンドランによる勝率の変化は
2 メジャーではキャッチャーの配球は評価されない?
 キャッチャーの地位を高めた野村克也/「配球」はセイバーメトリクスで評価できるか
3 「ホームランバッターは3番打者」はメジャーの常識か?
 日本では4番? メジャーは3番?/最強の打者は3番にすべきか、4番にすべきか

第4章 高校野球は「スポーツ」か? 「教育」か?――アマチュアとプロの違い
1 4割バッターにバントをさせる高校野球
2 1塁にヘッドスライディングをするべきか
3 2011年大卒ルーキー投手をセイバーメトリクスで比較する

第5章 あの名場面は統計学的に正しかったか?
1 パーフェクト試合目前で投手交替は是か非か?――中日落合監督の山井交代劇
 9回表に起こった悲鳴/投手交代は統計学的に見て正しい選択だったか
2 日本シリーズ3連敗の後の逆転劇をもたらしたもの――1989年巨人VS近鉄
 3連敗の後、4連勝で決着がつく確率は?/どのプレーが「流れを変えた」のか
3 千葉ロッテマリーンズが果たした「史上最大の下克上」とは?
 セ・リーグよりパ・リーグの方が強い?/3位千葉ロッテが日本シリーズに出場できる確率は?
4 「江夏の21球」をデータで読み解く




2010年度総合評価 (その7)

総合評価のうち守備の評価です。計算の手順は以下。

 (A) 各守備位置での得点を求め合計する。
 (B) Aを勝利数に変換する。
 (C) 守備位置補正得点を計算する。
 (D) Cを勝利数に変換する。
 (E) B・Dを合計する。

守備の評価パートでは、まず各守備位置内での守備の得失点を計算します。
内野手であれば推計ゴロ数に対する補殺のレート、外野手であれば推計フライ数に対する刺殺・補殺のレート、捕手であればイニングあたりの盗塁阻止・捕逸・失策を得点化して評価します。詳しい算出法はサイトにて(捕手守備評価内野手守備評価外野手守備評価)。
ちなみに総合評価はリプレイスメント・レベルに比べての利得ですが平均的に言うと守備のリプレイスメント・レベルは平均水準に等しいので守備の評価においてはリプレイスメント・レベルを勘定に入れるための別段の計算は不要です。言い換えると、選手を直接リプレイスメント・レベルと比較しているわけではなくて平均的な選手との差を出してそこに平均的な選手とリプレイスメント・レベルの選手との差を加算しているわけです。
各守備位置での得点を合計し、守備者として全体で貢献した点数(A)を計算します。

 A=捕手での守備得点+一塁での守備得点+……+右翼での守備得点

これを、リーグ平均得点(Rとする)とピタゴラス勝率式を利用して勝利数(B)に変換します。

 B=144×(R^1.7/(R^1.7+(R-A)^1.7)-0.5)

防いだ失点(守備得点)が多いほどチームの勝率は上がり、それが基準を上回る分を評価します。
これが守備位置の価値を考慮せずに守備で貢献した数字です。

守備位置の価値(C)は、前回紹介した数値を用いて単純に各守備位置を守ったイニング数から以下のように計算します。

 C=(16×イニング(捕手)-12×イニング(一塁手)+11×イニング(二塁手)-3×イニング(三塁手)+4×イニング(遊撃手)-6×イニング(左翼手)+2×イニング(中堅手)-4×右翼手-17×イニング(DH))/1280

そして、守備得点と全く同じようにして勝利数(D)に変換します

 D=144×(R^1.7/(R^1.7+(R-C)^1.7)-0.5)

守備位置の価値も含めた守備全体の貢献値(E)は、単純に(B)と(D)の加算で求められます。

 E=B+D

ここではFanGraphsのWAR発表形式に倣い、対象守備位置内での利得(B)をFielding、守備位置補正値(D)をPositionalと呼ぶことにします。
今回はその合計値をとって(Defense Total)リーグ別のランキングを示しておきます。
これでもう総合評価として全体のレーティングが算出可能になるという大変胸躍る展開ではあるのですが、おそらく総合評価の中でこの守備評価の部分が最も問題が多いことは一応指摘しておかなければならないでしょう。UZRあるいはプラスマイナスシステムなしに守備を評価することは非常にノイズが多く、選手ごとの差も必要以上に大きく出る傾向にあります。
推測ですが、総合評価のランキングを見たときに「え、この選手がこんなに高いの?」といった意外な結果は、多くが守備評価のノイズに起因することになるでしょう(もちろん見た側にとって意外でも真実の側からするとそれで正しいという場合もあるはずですが)。
したがって、ノイズをできるだけ除去して選手の価値を考えたい場合には守備の数字をかなりの程度平均へ回帰させるなどの処理を行なうことが無難ではあります。ここでそれを行なわないのは、真の能力を推定したいわけではないという目的の違いです。




セ・リーグ Defense Totalトップ30
順位球団選手FieldingPositionalDefense Total
1 T鳥谷 敬2.8 0.4 3.2
2 Bカスティーヨ2.4 0.6 3.0
3 S田中 浩康1.9 1.1 2.9
4 D森野 将彦3.2 -0.3 2.9
5 C廣瀬 純2.8 -0.3 2.5
6 G亀井 義行2.6 -0.2 2.4
7 C赤松 真人2.1 0.0 2.1
8 G阿部 慎之助0.6 1.4 2.0
9 T桜井 広大2.0 -0.2 1.8
10 T城島 健司0.2 1.6 1.8
11 S相川 亮二0.2 1.3 1.4
12 B藤田 一也1.2 0.2 1.4
13 D谷繁 元信0.2 1.0 1.2
14 D和田 一浩1.7 -0.5 1.2
15 C石原 慶幸0.0 1.2 1.2
16 D堂上 直倫0.4 0.5 1.0
17 T浅井 良0.8 0.0 0.8
18 D岩崎 達郎0.7 0.2 0.8
19 D野本 圭0.9 -0.1 0.7
20 T狩野 恵輔0.8 0.0 0.7
21 S福地 寿樹0.9 -0.2 0.7
22 G古城 茂幸0.5 0.2 0.7
23 C梵 英心0.3 0.4 0.7
24 B武山 真吾-0.2 0.9 0.7
25 B金城 龍彦0.6 0.0 0.7
26 C石井 琢朗0.7 -0.1 0.6
27 G長野 久義0.8 -0.1 0.6
28 Sデントナ1.1 -0.5 0.6
29 C嶋 重宣0.9 -0.3 0.6
30 G小笠原 道大1.0 -0.5 0.6


パ・リーグ Defense Totalトップ30
順位球団選手FieldingPositionalDefense Total
1 F田中 賢介2.0 1.1 3.1
2 L片岡 易之1.7 1.0 2.7
3 H本多 雄一1.6 1.1 2.6
4 F金子 誠2.0 0.2 2.2
5 F糸井 嘉男1.9 0.2 2.0
6 F飯山 裕志1.9 0.1 2.0
7 L細川 亨0.5 1.0 1.5
8 BsT-岡田2.1 -0.6 1.5
9 F鶴岡 慎也0.4 0.9 1.3
10 E聖澤 諒1.1 0.2 1.2
11 E高須 洋介0.5 0.7 1.2
12 E嶋 基宏-0.1 1.3 1.1
13 H山崎 勝己0.3 0.7 1.0
14 F大野 奨太0.3 0.7 1.0
15 Bsカラバイヨ1.0 -0.1 1.0
16 L佐藤 友亮1.1 -0.2 1.0
17 L浅村 栄斗0.9 0.0 0.9
18 H長谷川 勇也0.8 0.1 0.9
19 E内村 賢介0.6 0.3 0.9
20 F紺田 敏正0.9 0.0 0.8
21 M西岡 剛0.4 0.4 0.8
22 L坂田 遼0.8 -0.1 0.7
23 Bs日高 剛0.0 0.6 0.6
24 M里崎 智也-0.2 0.8 0.6
25 M今江 敏晃0.9 -0.3 0.6
26 H柴原 洋0.7 -0.1 0.6
27 Bs荒金 久雄0.7 -0.1 0.5
28 H江川 智晃0.6 0.0 0.5
29 L上本 達之0.0 0.5 0.4
30 Bs一輝0.4 0.0 0.4




2010年度総合評価 (その6)

守備編です。
守備をいかに評価するか、ということに関しては一応以前から取り組んでいる問題であり、基本的に守備位置ごとの評価は打球を処理する頻度の高さを守備位置の平均と対比させて評価をするということになります。また、捕手についても盗塁阻止などをベースにある程度評価はすることは可能です(捕手守備評価内野手守備評価外野手守備評価)。
問題は守備位置補正です。以下の議論はやや入り組んでいてわかりにくいかもしれませんがご了承ください。

守備位置補正をどう扱うか

守備位置補正の考え方についてざっくりみていきましょう。
遊撃手での+5と三塁手での+5は等価値に扱えません。おそらく、遊撃手で+5のレーティングを出す選手は三塁手として守った場合には+5を超える評価となるでしょう(必ずしもそうかはわかりませんが一般的には)。
したがって守備位置横断的に全体の評価を行なうには、この格差を定量的に表し補正をしてやる必要があります。
これに関して米国のWARで採用されている手法としては複数の守備位置を守った選手の守備評価から守備位置ごとの難易度を出し、各守備位置の価値を算出するものがあります。
たとえば遊撃手と三塁手の両方を守った選手のグループを見たときに、彼らが遊撃手として-2、三塁手として+3の評価であった場合、遊撃手の平均は三塁手の平均に比べて5点分難易度が高いものとして評価されます。このようにして全ての守備位置を比較していき、各守備位置の相対的な価値がわかれば、補正が行なえます。
遊撃手の補正値が+5であれば、平均的な野手(平均的な遊撃手、ではなく)が遊撃を守った場合には-5と仮想的にみなせるため、仮に遊撃手として0の評価でも野手全体と比較した場合には+5であると評価されます。
この手法は、守備位置間の評価の補正としてある程度適切なものだと私としても思います。

しかし、今回の総合評価では上記の補正の手法は採用しないことにします。理由は、NPBに関して実際に補正値を算出することが困難だからです。
困難とは何を指すかというと具体的には以下の2点があげられます。

・信頼のおける守備指標およびサンプルサイズが確保されない
MLBでは信頼のおかれる守備指標UZRのサンプルが多く確保できますが、日本ではこれを書いている時点の2011年前半で、やっと専門機関によるUZRが出始めたものの各選手についての詳細な数字は出ていないのに加えサンプルサイズが足りません。
代用的な守備指標を用いて計算をすることも可能でありある程度は意味を成すと思いますが、私の手元にあるデータは2005年から2010年までの6年分のデータに過ぎず、MLBに比べて球団数が少ないことも考え合わせるとサンプルサイズが少なくめちゃくちゃな結果が出てしまいかねません。複数の守備位置を守った選手という特殊な例に対象をしぼるためそもそも数が確保しにくいのです。

・算出法自体に技術的な困難性が多く恣意性を排除できない
サンプルが確保できたとしても、それをいかに計算し最終的な結果を出すかは難しい問題です。
そもそも複数の守備位置を守るという時点でそのサンプルは特殊な場合である可能性が高く、その時点でサンプルは守備位置ごとの難易度の違いそのものをうまく代表するものではないという懸念があります。外野手が故障を抱えたため一塁手で起用された場合など、守備位置そのものの影響以外でパフォーマンスが悪化することが考えられます。
そうなれば事情を上手く考慮して補正する必要があるのですが、どのようにその過程を行なうかについては客観的で明確な筋道を定めることが難しく、恣意性が介入することになります。

また、これは守備指標による補正を否定する理由ではなく別の話ですが、私は総合評価の守備位置補正として守備指標の補正だけをするのは若干片手落ちで理想的には打撃についても補正が必要だと考えております。
仮に守備位置を変えて守備指標の評価が変わらないとしても打撃指標は変化する可能性があり、それが傾向として出ているなら補正すべきだろうと思うからです。
理由はともかくとして、「平均的な野手」の打撃指標が仮に捕手を守った場合に低下するとしたら(たとえばOPS.730から.700に)、捕手でOPS.730を打つことは平均的な野手に比べてのアドバンテージをチームに与えていると評価できます。守備指標の変化に関わらずです。ですから私は守備位置補正には(理想的には)守備評価の補正に加えて攻撃評価の補正が必要だと考えます。

そして今回の総合評価でどういう補正をするのかというと、打撃指標を使った補正値という比較的伝統的な手法を用いたいと思います。
これは、たとえば一塁手の平均的なBatting Runsが+10であれば、一塁手の総合評価を10ポイント割り引くというものです。
この手法は守備の関係と直接的につながるものではないという大きな問題を抱えています。二塁手の打撃指標が-10だとしても、それは二塁手という守備位置の難易度に起因するのではなく、ただ単に二塁手を守っている選手が全体として打撃の能力に乏しいだけかもしれないからです。条件が異なるわけでなく単純に能力が低いだけの選手の評価を補正して持ち上げるなどというのはおかしな話です。
しかし守備位置を基準として打撃指標を分けた場合に評価に違いが出るというのは守備位置に起因する何らかの理由があると「推測」することも可能で、それを含めて打撃指標の数字を守備位置補正に用いることのメリットは以下のように挙げることができます。

・算出が容易である
打撃指標は(LWTSであれRCであれ)算出法が比較的固まっていて、あまり議論の余地がないため明確に計算できます。
また、サンプルサイズも守備指標に比べれば十分多く確保できます。
おそらく誰が計算しても結果はほとんど同じになるため、その意味では客観性があると言えます。

・守備の負担を何らかの形では反映しているだろうと推測される
もし守備位置ごとの難易度に全く違いがないのであれば、野球においてどの守備位置でも同じような打撃の結果となるのが自然でしょう。
しかし現実にはそうではありません。これは背理的に守備位置ごとの難易度の違いを示唆します(ただし、繰り返しですが打撃指標でそれを直接的に表せるわけでくそれが最大の問題です)。

・守備位置の打撃補正を含める可能性がある
打撃指標を使って補正値を求めることから、前述した議論の守備位置の打撃補正を含めることができる可能性があります。
ただし同じ選手同士を比較していくわけではないため「傾向としてその一部に含むだろう」程度の意味です。

・悪くても守備位置内傑出度として使える
守備指標は元々対象の守備位置における相対的な利得を表します。
そして打撃指標で補正を行なうと、総合評価は結果的に「守備位置平均に対する打撃の利得+守備位置平均に対する守備の利得」で対象の守備位置内での傑出度を表すものとなります。
野球は原則として全てのチームが同じように守備位置を割り振って試合を行なうことから守備位置内での傑出度チームに与える利得の考え方として重要であり、それは野手全体の貢献そのものを一次元的に、横断的に評価するものではなくてもまた別のものとして有用な評価となり得ます。各選手の守備位置内での傑出度を全体で比較することも、それ自体には問題はありません。左翼手として+10の選手と遊撃手として+5の選手は能力は後者のほうが上かもしれませんが、守備位置内での利得は前者が上である(と評価されている)こと自体は間違いないわけですから。

結果の数字は以前サイトで行なった守備位置別打撃成績の研究から、600打席(あるいは1280イニング)あたりでこうなります。

 捕手 +16
 一塁手 -12
 二塁手 +11
 三塁手 -3
 遊撃手 +4
 左翼手 -6
 中堅手 +2
 右翼手 -4
 DH -17

捕手でフル出場した選手であれば守備位置補正を除く総合評価値に16が加点されることになり、一塁手と三塁手が半々で出場した選手の場合には-12と-3の中間で-7.5の補正値となります。遊撃手でシーズンの半分程度出場した場合の補正値は+2です。

最後に、計算に必要な守備イニング数のデータは、2010年度分ついてはSMR Baseball Labで得られるためそれを参照します。
ただしDHのデータは得られないため、打席数に対して見込まれる一般的な守備イニング数と実際に守った守備イニング数を比較して後者が顕著に少ない場合には差分をDHでの出場イニングとみなすという手法をとります。つまり守らなかった守備イニング数を数えます。
平均的には1打席の出場に対して2.13の守備イニングが見込まれます。実際には打順の関係などでブレがありますので見込み守備イニングに比べて実際の守備イニングが200以上少ない場合のみDH出場として考慮することにします。


次回は具体的な計算を行いデータを掲載します。



2010年度総合評価 (番外編)

総合評価の話に関しては投球・打撃と評価が終わり守備に入るのですが、ちょっと番外編を。


投手の守備について

投手の評価をFIPという指標を使って行いましたが、あれは正確に言えば「投球」の評価です。
つまり、投手という一人の選手という単位で考えたときに、守備と打撃という側面は切り落とされているわけです。
このうち打撃については他の野手と同じように評価することに原則的には問題はありません。
少し議論になり得るのは投手の守備の評価です。

FIPで評価されるアウトは奪三振だけです(分母である投球回のことも考えると少し事情は違うのですがとりあえず無視して考えます)。
しかし、打球となった結果投手が自分で処理してアウトを成立させたのであれば、それは投球で奪ったアウトではないかもしれないけれど投手自身の手柄によるアウトだと考えることは貢献の観点から見れば可能です。そして同時に妥当だと思います。
ではこの投手の守備をいかに評価すべきなのでしょうか。

通常の野手であれば、守っている間に飛んできた打球のうちどれだけをアウトにしたかという方向で評価を行います。
投手の場合投球成績から自分がマウンドにいる間のBIP(Balls In Play)が算出可能ですから、それと奪ったアウトである補殺の比をとれば打球をどれだけ処理しているかの数値自体は算出できます。
しかし、野手の場合投手の要素はさまざまに分散され打球分布の偏りがなくなることを想定しているのに対し、投手の守備を計算する場合には投手自身の投球による打球分布の偏りがモロに出てしまうと思われます。すなわちBIPに対するアウト付与数が多くてもそれは守備の上手さの指標にはなりづらいということです。
であれば、他の野手と同じように守備に就いた機会あたりのアウトのレートを評価することに大した意味はありません。
むしろ「結局自分で成立させたアウトがある」という事実を単純に勘定に組み込むという方法はどうでしょうか。

そこで考えたのが、FIPに投手自身の補殺を組み込んでしまうという方法です。
投手が自分で成立させたものであること、プレーとしてアウトであることから、FIP上の位置と得点加重は奪三振とほぼ同等であるものとみなせば以下の式が考えられます。

 改造FIP=(13×被本塁打+3×与四球-2×(奪三振+補殺))/投球回

投球成績の中に急に守備の項目が登場するため違和感バリバリの式です。しかしこれで(強引ながら)一応投手自身の守備を含めた、他の守備者からは独立した評価が計算されます。
Pitcher's fielding Included FIP、piFIPといったところでしょうか。
この式を使って投手の貢献値(total win)を計算し直したところ、通常のFIPを用いる場合との差は最大値で0.5でした。得点では5点相当でこれ自体はバカにはならないですが両リーグで327の投手がいるうち最大でもこの程度の違いしかないのですから、この方式では基本的には単純にFIPを計算する場合と比べてほとんど違いはないと言えます。

投手については一度算出してしまいましたしこの方法は思い付きの面も強いので今回はこの点については深入りしませんが、いずれにせよ今後は何らかの方法で投手の守備も組み込まなければと思っています。



指標の信頼性と平均への回帰


※本エントリーはやや長いです(5,000字弱)。とりあえずブログにアップしてそのうちサイトに掲載する予定のものですのでお時間があるときにどうぞ。


1.重要な統計的性質

 セイバーメトリクスを考える上では、統計(学)に関する理解も重要となります。私は決して専門家ではありませんが、これまであまりちゃんと考えてこなかった「平均への回帰」に関する考え方の重要性を最近重く感じており、自分はこういう認識で話しているという表明の意味と単なる勉強ノートの意味を合わせて、ここに記述を試みたいと思います。ここに書く内容には私にとって根拠が必ずしも明らかでないものも含まれますし、細部の詰めは今後の課題としているところもあります。不適切な箇所に関する指摘は喜んで受け付けます。そのあたりご了承下さい。


2.古典的テスト理論

 心理学等の分野でよく用いられるらしい理論に、古典的テスト理論(Classical test theory)というものがあります。これはテストの結果など統計データを分析する際、観測値を真の値と誤差の関数と考えるものです。

 観測値=真の値+誤差

 観測値というのは野球の記録で言うなら単純に、選手の打率とか出塁率とか何らかの形で記録した数値のことです。真の値はその選手が持つ「本当の」数値で、たとえば通常のコンディションを保ったまま1億回打席に立たせた結果の打率と考えられます。それだけ打席数があれば偶然の影響は排除されるでしょう。誤差は指標の数値に系統的な関係を持たない観測値への影響です。たまたまその日の体調が良いとかヤマ勘が当たったとか。ランダムなものを指します。このランダムな誤差の特徴は、十分な試行数があれば平均化され最後には真の値の影響だけが残る点です(だから「1億回打席に立たせた結果の~」という言い方が成立します)。真の値と誤差に関しては完全な形で直接に計測することはできず、できるのは推定することだけです。

 ある選手のシーズンの打率が.287だったとして、その選手の本当の実力がちょうど.287である可能性は高くありません。そこには何らかの形での誤差が影響しています。これは誰もが経験的に了解していることでしょう。このことを明瞭に理解するために古典的テスト理論のモデルは役立ちます。ただし、簡略化したモデルであることには注意が必要で、たとえば観測値に選手個人以外が与える系統的な要因については考慮していません。パークファクターによって本塁打が多い場合でも、それは誤差には入りません。


3.信頼性

 観測値を真の値と誤差の和と考えるモデルから、信頼性(reliability)という考え方が導き出せます。信頼性というのは、その観測値(指標)がどれだけ選手の能力を的確に、少ない誤差で反映しているのかを定量的に表すものです。

 信頼性は、データのばらつきの度合いを表す分散という統計量を利用して以下のように表されます。

 信頼性=真の値の分散/観測値の分散

 つまり実際に観測されるデータのばらつきのうち、選手の実力の違いによるばらつきの割合です。3人の打者の打率が.267・.289・.314だったとして、このばらつきは誤差による部分が大きいのかそうではないのかということを信頼性は評価します。

 そして古典的テスト理論のモデルより、観測値というのは真の値と誤差の和ですから、観測値の分散は

 観測値の分散=(真の値+誤差)の分散

 ここで、誤差は定義上真の値と系統的な関わり(相関)がなく独立のものです。変数が互いに独立の場合分散は加算になりますから

 観測値の分散=真の値の分散+誤差の分散
 ここから
 信頼性=真の値の分散/(真の値の分散+誤差の分散)


 というふうに分解できます。つまり選手ごとに実力のばらつきがしっかりとある場合、誤差の影響が少ない場合に信頼性は高くなります。また全体の分散のうちの割合という形をしていますので、信頼性の値は具体的には0から1までの間となります。

 具体的に信頼性を計るにはどうすればいいのでしょうか。まず上記の考え方にそって数学的に計算する場合を考えてみます。真の値の分散と誤差の分散がわかれば信頼性の計算ができるのですが、真の値の分散は直接計測できません。しかし分散が加算となる性質を利用すると、観測値の分散から誤差の分散を減じたものであるとみなせるので、誤差の分散から間接的に推定する方法があります。式は以下で考えます。

 信頼性=(観測値の分散-誤差の分散)/観測値の分散

 ここまでに3つ信頼性の式が出てきていますが全て言い換えているだけで中身は変わりません。

 具体的に、打者の出塁率の場合として考えてみます。仮に規定打席に到達した打者の出塁率観測値の分散が0.034^2だとし、彼らの平均出塁率は.330で、打席数の平均は550とします。結果が成功か失敗かという二項の形で得られる試行の分散は確率の計算から成功率をp、試行数をnとして以下のように求められます。

 誤差の分散=p×(1-p)/n
 出塁率の例では  0.33×(1-0.33)/550=0.020^2


 これが誤差の分散となります。ただし集団に含まれる打者の打席数は細かく違うのであって、どのようなnを用いるのが本当に適切かどうかなどについて厳密にはわかりません。ここでは誤差の分散の推定くらいに考えておくことにします。

 観測した、そして計算したふたつの分散を用いると真の値の分散と信頼性が計算できます。

 出塁率の信頼性=(0.034^2-0.020^2)/0.034^2=0.65
 (信頼性=(観測値の分散-誤差の分散)/観測値の分散 の式の形)


 このように信頼性を計算(推定)することができます。

 以上のような計算を念頭において考えると、試行数と信頼性の関係というのも明確になります。真の値の分散(選手ごとの実力の違い具合)は、どのくらい実際の打席に立っているかによって変わる類のものではありません。とりあえず一定と考えられます。集団の平均値も同じように一定とみなします。一方、誤差の分散は「p×(1-p)/n」ですから、nすなわち試行数が増えると反比例して値が減少していきます。結果、誤差の分散に対する真の値の分散の比率が上がっていき、試行数の増加に応じて信頼性が上昇することがわかります。これははっきりと「少ない打席数のデータはあてにならない」とか「多くの打席数に立てば偶然の影響は平均化される」とかいうことの記述になっています。

 ただしここで説明している「信頼性」という言葉は多少ミスリーディングです。信頼性は誤差に影響される割合が小さいかどうかを表すのみであり、「再現性」や「一貫性」というような表現も可能です。信頼性が高いことはそれが特定の目的に対するものさしとして妥当であることを意味するものではありません。具体的に言うと問題はバイアスの存在であり、たとえば世論調査で男性から回答を得る割合が偏って高ければ仮にそれが十分な標本数で誤差の小さいものであっても世論を妥当に表すものだとは言えません。野球の統計でも、仮に信頼性が高くてもその指標はチームメイトの影響などを大きく受けたものであるかもしれません。


4.信頼性の経験的な算出方法

 信頼性の係数を算出するとき、経験的なデータを用いた方法が採用されることが多いです。いくつか例をあげます。

 再テスト法
 同一の集団に、同じテストを2回受けさせ、それぞれの得点の相関係数を信頼性とする方法。セイバーメトリクスでは、2年連続して一定機会以上出場した選手について1年目の成績と2年目の成績の相関係数をとるyear-to-year correlation(経年相関or年次相関or年度間相関?)がこれの一種と考えられるのではないかと思います。ある年に出塁率が高かった選手は翌年も高く、逆に低かった選手は翌年も低いという傾向がはっきりしているのであれば、出塁率は選手の実力を反映しているだろうと考えることは合理的です。これは計測が比較的容易で理屈も直感的に納得できるためよく利用されますが、1年だけのデータに関して信頼性を計算できないことと年をまたぐことで選手の実力そのものが変化してしまうことが問題点としてあげられます。

 折半法
 1つのテストを何らかの方法で同質とみなせるふたつのデータに割り、両者の相関から信頼性を計算する方法。野球のデータで言えば、あるシーズンの打率を前半戦の打率と後半戦の打率に分けて相関をとるというようなことです。ただしそれだと「後半戦に体力の問題で成績が悪化した」などの指標の性質の問題でない要素によってデータ間の違いが出てしまうので、偶数番目の打数と奇数番目の打数に分けるなど、どちらにもそれぞれの期間のデータがだいたい同じように振り分けられるような工夫がとられます。これもセイバーメトリクスで比較的よく用いられる手法のようです。

 Cronbachのα係数
 計算式を使い、折半法で可能な全ての分割に対する相関係数を計算し平均をとった場合と同等の数値を計算する方法。折半法のように分割方法に値が依存することがないため客観的で効果的とされます。社会科学ではメジャーなようですが、セイバーメトリクスでは指標がαをキレイに計算できるような「テスト」になっていないためか、用いられる機会を見かけないように思います。


5.平均への回帰

 信頼性の計算を、真の値の推定に活かすことができます。信頼性が十分に高い場合単純に観測値を真の値の推定とすることに大きな問題はありませんが、信頼性が低い場合には観測値は適切に真の値を表していない可能性が高いです。信頼性を利用して真の値を推定するには個々の観測値と集団の平均のデータを使用し、信頼性の係数でそれぞれに重みをつけます。

 回帰された観測値=信頼性×(観測値-観測値の平均)+観測値の平均
 または
 回帰された観測値=信頼性×観測値+(1-信頼性)×観測値の平均


 こうすると信頼性が1でない限り観測値は平均値へ近づくことになり、統計データのこのような性質を平均への回帰といいます。そもそも観測値の分散は真の値の分散と誤差の分散の和でしたから、誤差の分散の大きい少ない試行数では選手ごとの観測値のばらつきは「ふくらんで」出ているわけです。したがって、データに接するとき、基本的には観測値をそのまま真の値であるかのように扱ってはいけません。本来の値のばらつきを過大評価することになります。

 「あらゆる成績は平均へ回帰する」などと言われますが、そのくらいこの「観測値と真の値は別である」ことの理解は重要だと思います。わかりやすい例で言えばシーズン開始当初に4割を打っている打者もシーズン終了時には平均へ回帰し、3割台前半やあるいは2割台などに下がることになります。そしてシーズン開始当初の成績もシーズン終了時の成績も選手の通算成績も観測値であることに本質的な違いはなく、あるのは信頼性の定量的な違いです(もちろんシーズンごとに優秀な観測値を表彰する、といったことは別問題であり文句はありません)。あるいはパークファクターなどの数値も、1年程度の観測値では誤差を多く含むためにその球場がもつ本来の影響の大きさを観測の都合によって過大評価することになりかねません。やはり信頼性と回帰の考え方が重要となります。

6.おわりに

 冒頭のくり返しになりますが私は統計の専門家ではありませんし理解がやや曖昧なまま書いている部分もありますのでご指摘はいつでも受け付けたいと思います。ただしここに書いた諸概念は野球のデータ解析であまり認識されていない現状はあると思っていますので認識や議論のきっかけにでもなれば幸いです。




参考
仔猫の遊び場―心理学
Research Methods Knowledge Base
Classical test theory(en.wikipedia)
統計WEBコラム「誤差の問題」



先日の地震について

管理人は神奈川在住ですのでこれといった被害もなく無事です。
テレビで情報を見るとまだまだ大変な方が多くいらっしゃいますし、こちらも停電の関係などで少々普段と違い生活がざわざわしているところはあって気を抜くと落ち込んでしまいそうです。
とはいえ自分の被害は全然軽いほうであるわけで、また無事だった人間の務めとしてやるべきことが「テレビの情報を見てブルーになること」ではないだろうとも思うので、もしかしたらこんなときになんだと思われるかもしれませんが前から書いていたものをアップするなどで少しずつ更新をしていきたいと思います(元々あまり更新していないので変化はないですが)。
被災されたみなさまに心よりお見舞い申し上げます。一日も早い復興を祈っております。



2010年度総合評価 (その5)

今回は打者の評価です。
打者の評価はLWTSで非常に簡単に行なえるものであり、工夫として加わるのはPF補正とRun-Winコンバートくらいです。

算出は以下の手順で行います。

 (A) LWTSにより、打席あたりにどれだけ得点期待値への貢献があるかを計算する。
 (B) 平均的なチームに対象の打者が加わった場合の総得点を計算する。
 (C) Bを勝率に変換する。
 (D) 同じ打席数をリプレイスメント・レベルに任せた場合の総得点を計算する。
 (E) Dを勝率に変換する。
 (F) C、E両者の勝率を比較し、貢献した勝利数を導き出す。

打者の仕事はチームの得点数を増やすことであり、それは打者が発生させた各事象が得点期待値にどのような影響を与えるものであるかにより計算することができます。
ここでは日本版LWTSの数字をもとに、アウトをゼロとして補正した打席あたりの数字(サイトなどでRVAと呼んで使用してきたもの)を求めます。故意四球、犠打等はチームの戦術などが絡むため今回は解析の対象から除外することとします。

 RVA=(0.56×(四球-故意四球+死球)+0.71×安打+0.33×二塁打+0.69×三塁打+0.96×本塁打+0.17×盗塁-0.31×盗塁刺)/(打数+四球-故意四球+死球+犠飛)
 A=RVA+(1-PF)×リーグの打席あたり得点

PFは得点PFの跳ね返り倍率で、本来的にはアウトを単位とする数値であるため打席数に掛けて計算するのは正確ではないものの近似としては問題はないと判断しています。
ここからリーグの平均RVAを引き打席数をかけると、平均的なチームに加わった場合どれだけ得点を増やすかが計算できます。ここにリーグの平均チーム得点(長ったらしいのでRとおく)を足したものが、対象の選手が加わったチームの総得点(B)となります。

 B=R+打席×(A-リーグ平均RVA)

この場合のチームの勝率(C)は

 C=B^1.7/(B^1.7+R^1.7)

です。
リプレイスメント・レベルの打者はRVAではリーグ平均の0.86倍程度のパフォーマンスであることが過去の統計からわかっていますので、対象の打者と同じ打席数の分だけリプレイスメント・レベルの打者に出場させた場合のチーム総得点(D)は以下のように計算されます。

 D=R+(0.86-1)×リーグ平均RVA×打席

この得点数でのチームの勝率(E)は

 E=D^1.7/(D^1.7+R^1.7)

となります。
最終的に、対象の打者がチームにいる場合の勝率(C)と、リプレイスメント・レベルに出場させた場合の勝率(E)を比較し、その打者が出場することによってシーズン全体でどれだけの勝利数が上積みされたか(打者の最終評価であるBatting)が求まります。

 Total Win(Batting)=(C-E)×年間試合数

年間試合数は、2010年であれば144試合です。
ちなみにこの評価式のショートカットは「(RVA-0.86×lgRVA)×打席/10」です。



2010年のリーグ別上位者30人を示します。

セ・リーグ
順位球団選手打席RVABatting
1D和田 一浩602 .3698.2
2S青木 宣親667 .3326.8
3D森野 将彦626 .3306.3
4Tマートン668 .3186.0
5G小笠原 道大591 .3295.9
6G阿部 慎之助569 .3335.9
7Gラミレス606 .3235.7
8Tブラゼル601 .3155.3
9T鳥谷 敬651 .3065.1
10T新井 貴浩641 .3075.1
11T城島 健司602 .3054.7
12C梵 英心659 .2954.3
13G坂本 勇人676 .2914.3
14Dブランコ561 .3024.2
15T平野 恵一593 .2973.7
16C廣瀬 純546 .2963.7
17B内川 聖一637 .2783.3
18C栗原 健太450 .3003.3
19Bスレッジ533 .2843.1
20Sホワイトセル268 .3403.0
21G長野 久義459 .2862.7
22Bハーパー261 .3322.7
23S畠山 和洋280 .3202.6
24S田中 浩康637 .2682.5
25S飯原 誉士492 .2752.4
26D荒木 雅博625 .2632.3
27B村田 修一617 .2592.0
28G高橋 由伸332 .2841.9
29S相川 亮二474 .2641.8
30G脇谷 亮太459 .2651.8



パ・リーグ
順位球団選手打席RVABatting
1M西岡 剛692 .3236.2
2M井口 資仁650 .3185.6
3Bsカブレラ481 .3435.2
4H多村 仁志559 .3245.1
5F糸井 嘉男583 .3215.0
6L中島 裕之579 .3114.6
7F田中 賢介662 .3014.6
8BsT-岡田520 .3184.5
9E鉄平555 .3013.9
10L栗山 巧660 .2893.8
11M今江 敏晃596 .2943.6
12F稲葉 篤紀591 .2893.5
13L片岡 易之643 .2843.5
14F小谷野 栄一614 .2863.4
15H川崎 宗則662 .2813.4
16Bs坂口 智隆622 .2823.3
17M金 泰均614 .2813.2
18Hオーティズ457 .2892.7
19Bs後藤 光尊632 .2712.7
20Mサブロー513 .2782.5
21Bsバルディリス434 .2862.4
22Bs北川 博敏403 .2902.4
23L中村 剛也354 .2962.3
24H本多 雄一651 .2662.3
25M福浦 和也359 .2922.2
26H小久保 裕紀469 .2752.2
27M大松 尚逸603 .2642.2
28Lフェルナンデス243 .3202.1
29L高山 久423 .2782.0
30E嶋 基宏485 .2722.0




DIPSとFIPの混同および定数について

日本においてDIPSとFIPはどうも混同されています。
それについて『プロ野球記録博物館』というサイトさんに「3.12 はどこから来たのか」という面白い記事が掲載されています。中身が濃く、そのリサーチ力には敬意を表したいです。

私が勉強したところからすると、こちらのサイトに書かれていることは完全に正しいです。
元々ボロス・マクラッケンは細かなステップを踏んで投手の各成績項目を「守備から独立した」ものに補正し、そこから間接的に防御率も計算しています。いきなり被本塁打や奪三振に係数を掛けて防御率を出すことはしていませんし防御率だけが目的ではないように見受けられます。
その意味で「Defense Independent Pitching Stats」は考え方であり、数値「群」みたいなものです。

日本で一般的にDIPS及びDIPSeraとして用いられる被本塁打・与四球・奪三振から仮想防御率を計算する式はタンゴタイガーによるFIPがもとになっているようです。
たとえばWikipediaには「DIPS」の式として (与四球×3+被本塁打×13-奪三振×2)÷投球回+3.2 というものが載っていますがこれはFIP式です。しかも3.2とか3.12とかいう定数について意味が理解されていないらしい感じがあって、使用法に混乱が見られます。
定数はただFIPのスケールをリーグの防御率に合うように補正するためのもので、本来フローティングです(詳細)。定まった数字はありません。
前にこのブログにも書いたのですがこれによって不自然に高いまたは低い数字が出ると問題なのは、「DIPS」と実際の防御率を比較して運か不運かといった評価をするのがありがちな使用法だからです。仮にそういう比較をする場合、定数はちゃんと合わせるべきでしょう(しかも残念なことに3.2や3.12というのはNPBにはあまり合っていません)。
別に定数を固定で使用すること自体には大した問題はないと思うのですが、それならそれで利用の範囲を誤らないように注意しなければなりません。

WikipediaのDIPS項目に掲載されている情報はあまり正確ではないと思われるので、あれはそのまま信じないようにしたほうがよいと思います。
「結果的に使える式が一緒ならなんでもいいよ」と思う方は多いでしょうし、もちろん私も色々と間違った認識をしているところはあると思いますのでたまたま知っているからといって得意気に指摘はできないのですが、やはりできるならわかっていることだけでも誤りは正すべきだと思います。これだとボロス・マクラッケンにもタンゴタイガーにも失礼でしょう。
とりあえず最初に考え方を提唱したのがボロス・マクラッケンであり「(与四球×3+被本塁打×13-奪三振×2)÷投球回」のように係数を使って簡単に防御率評価を行なうのはタンゴタイガーのFIPだということが認識されるべきかと。
まぁ厄介なのは、「私は投手の評価をDIPSによって行なう」と宣言してFIPの式を使っても間違いとは言えないというところでしょうか。

知っている限りの知識で色々と生意気を書きましたがここに書かれている内容にも間違いがありましたらご指摘いただけると幸いです。
正直Wikipediaのセイバーメトリクス関連項目には色々言いたいことがあるのですが私のようなセイバーメトリクスを広めたい立場に偏った人間がガンガン書くのもどうなんだろうなと。おかしな認識が広まっていたら指摘はしたいですがWikipediaを正すことに本質的な興味はありませんし。前から考えているのはこっちはこっちでセイバーメトリクスのWikiを作ってしまえばいいのではないかということですが、なかなかそうするだけの時間もありません。


成績予測(Baseball Lab)


2011年各球団主力選手の成績予測 (Baseball Lab)

成績予測のシリーズが開始。
書かれている通り、日本ではほとんど取り組みがなかったのでこれが広まっていくと面白そうです。そういう文化自体知らなかった方には新鮮なのではないでしょうか。
予測の手法に関してはどうなのでしょうかね。MLBなどで見られるものに比べると余計な手を加えない叩き台的なものに見受けられますが、このようにあえてシンプルなのが有効なのか、どうなのか。
サイトに掲載するものということで事情や配慮など色々あると思うのですが、率直に申し上げるとさまざまに考えられるプロジェクションの中で今回の手法に関しては特に「信頼を置いて」いるという表現はちょっと違和感があります。まぁそのあたりは結果次第というところもあり、今季は私もプロジェクションに挑戦してみたのでシーズン終了時には答え合わせ的なことも楽しみです。自分のプロジェクションはこのブログで個人的に出そうと思ってます。


BABIPについての語れなかった問題

この前Baseball Labに書いたBABIPの総論で語れなかったもうひとつの重要な問題。

「BABIP」ってそもそもどう発音すればいいのか?

自分としては今まで(心の中で)ずっと「バビップ」と読んでおりました。
しかし最近見たとあるサイトには「ビーエイビーアイピーと読む(すなわちスペルそのままで)」ように書いてありまして。
いや、そう言われてもこっちはもうずっと「バビップ」で(心の中で)馴染んじゃってるし。
と思いつつコチラ(What is BABIP?)を見てみて
やはり「バビップ」でいきたいなというかそうじゃないと戸惑うというか。日本のみなさんはどう発音されているんでしょうかね。


 | HOME | 

プロフィール

管理者:クロスケ

野球全般好きで、プロ野球をよく見ますが特定の球団のファンではありません。
セイバーメトリクス(野球の統計的分析)の話題が多く、馴染みのない方にはわかりにくい内容があるかもしれませんがサイトに体系的にまとめています。

Baseball Concrete



RSSフィード

最近の記事

最近のコメント

カテゴリー

月別アーカイブ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。