かえるん日記

当たった時は謙虚に。外した時は冷静に。

競馬予想における、データ(傾向)の取り扱いを考える。

どうも、かえるんです。中の人が就職活動中ということもあり平日はあまり更新できていませんが、休日の予想回顧はしっかり行っていく予定ですので、引き続きよろしくお願い致します。

競馬予想とは過去データの分析である

競馬の予想というのは、ざっくり言えば過去のデータ(傾向)の分析だと思います。競馬のレースが行われれば、その情報はデータベース(傾向バイアス)へと積み重なっていきます。その積み重なったデータを片っ端から分析していくというのも手段の1つとしてはありますが、それは作業効率的に良くないですし、あまり現実的とは言えません。そうなるとやはり、必要となってくるのは「データの取捨選択」です。どの既存データを使用し、購入馬券の決定にどう繋げていくか。これが競馬予想のおおよその流れだと思います。そこで今回の記事では、主観的な見解も絡めつつ、競馬予想に関する20のデータ(傾向)の取り扱いについて解析・吟味をしていきたいと思います。

①このレースは〇歳が強い!

まずは馬齢によるデータです。基本的に傾向を見る際には「どうしてその傾向が生まれるのか」という考察が必ず必要だと思います。例えば「このレースは4歳が強い!」というデータが出ているとして、それが「このレースは賞金の少ない明け4歳の有力どころが良く使う傾向にある」という明確な理由を持つものなのか、「よくわからんけど毎年4歳が勝つ」という曖昧な理由によるものなのかで話は大きく変わってきます。後者であればたまたま強い4歳馬がそのレースを使っていただけということになりますし、それが今年のそのレースで再現される期待値というのは特に高まりません。

②このレースは牝馬が強い!

馬の性別によるデータですが、これに関しては基本的に度外視できると思います。夏に牝馬が強いというデータは調べればいろいろ出てきますが、勝率ベースで見ると確かに牝馬が強いようにも見えますが、回収率ベースで見るとそれほど有意な差はないんですよね(牝馬が夏に強いという通説により牝馬のオッズが下がるため)。ただ牝馬の得意条件というのは基本的にスピード質、瞬発質のセッティングで、ジャパンC牝馬が強い理由がこれに該当します。「このレース」はというより、「このコースは」瞬発質のレースラップになりやすいから牝馬が強いという風に考えるべきだと思います。

③このレースは芦毛が強い!

馬の毛色に関しては完全度外視でいいと思います。いろいろ調べましたが有意な差はありません。

④このレースは馬体重〇〇キロ以上が強い!

これもどちらかといえば信頼するには危険なデータだと思います。馬体重が重いからパワーがあるということもないですし、馬体重が軽いからパワーがないということも一概には言えません。ただ全体的な傾向として(主に下級条件)、馬体重が重い馬のほうが軽い馬よりも勝ち上がりが良いというデータはあります。

例外的な話をすると、新潟千直については「馬体重が重い馬のほうが圧倒的に強い」というデータが出ています。これは馬体重/斤量という数値で見ると非常に顕著で、理由はさておきベタベタに使えるデータとなっています。

⑤このレースは前走から馬体重マイナスが強い!

基本的には度外視していいデータかと思います。馬体重が減る要因、増える要因は馬それぞれ違いますし、「なぜそのレースは馬体重が減った馬が強いのか」という正当性のある答えはあまり見出せません。馬体重の増減を見るなら、「この馬は馬体重が増えた時のほうが強い」というような馬単体による縦の比較を用いるべきではないでしょうか。

⑥このレースは〇〇産駒が強い!

競馬はブラッドスポーツなので、血統的な考察は必ず必要です。ただ「その馬は本当に〇〇産駒の特徴を保持しているか」という点には注意しておくべきだと思います。わかりやすい例で挙げるとグレイルという馬は左回り(このブログでは直線の長いコースという意味)が苦手でしたが、ハーツクライ産駒は左回りが基本的に得意です。こういった血統傾向から逸脱する馬の存在は常に考慮にいれる必要があると思います。

⑦このレースは〇枠が強い!

これはどういうレースラップになりやすいのか、どういうコースレイアウトなのかというのにかなり依存しますし、非常に有用性の高い指標です。ただ、その傾向がコースレイアウトに逸脱する場合には注意が必要かと思います。いわゆる「たまたまその枠に何年か連続で強い馬が入っただけ」という可能性についての吟味が必要となります。

⑧このレースは逃げ馬が強い!

これも同じくレースラップやコースレイアウトに依存する話のため、非常に有用性のある指標のように思われるかもしれませんが、個人的には全く考えなくていいと思っています。去年のフェブラリーSなんかがわかりやすい例かもしれませんが、レース前は「逃げが厳しいレース、コースレイアウトだから」というデータ分析のもとインティを消してしまう人が続出しました。ただメンバー構成や枠の並びを見ると、インティ楽逃げの再現性は高い形でしたし、やはりレース展開的な考察は、コースレイアウトよりもその時のメンバー構成(逃げ馬の有無・先行馬の割合)、もしくは当日の馬場のほうに依存しやすいのかなという風に感じます。使用するのであれば、「このレースは逃げが強いし、今回のメンツ構成を見ても楽逃げが出来そう」というような二段階の考察を入れるのが望ましいのではないでしょうか。

⑨このレースは斤量〇〇キロの馬が強い!

斤量に関しては使えると思います。特に別定戦に関しては落ち目の実績馬なんかが斤量を背負って飛びやすいレースというのはある程度決まってきますし、ハンデ戦においても斤量の軽い上がり馬が勢いで勝ちやすいというレースは割と絞れてきます。もちろん馬の実力とハンデキャップの乖離については考察すべきですが、ハンデ帯である程度絞るというのは1つの予想手法としてありではないでしょうか。

⑩このレースは〇〇騎手が強い!

もちろんたまたま良い馬にその騎手が乗っていたという線も考慮すべきですが、基本的にレース質が騎手の特性と合うかというのは重要になってきます。例えば松山Jなんかは京都ダートでは度々穴を開けるものの、中京ダートでは人気馬をことごとく飛ばします。これは騎手の特性とコースレイアウトの相関性が理由で、松山Jは縦への意識が強くコーナーでよくポジションを押し上げていくのですが、中京ダートはコーナーで押し上げて行った馬は例外なく全てバテるため、松山Jの中京ダートの成績が壊滅的であることへの説明が付くんですよね。そういった騎手の特性とレース質が合っているかという考察は必要だと思いますし、「この騎手は上手い」「この騎手は下手」ではなく、もっと騎手の乗り方に目を向けたアプローチが重要になってくるのではないでしょうか

⑪このレースは〇〇厩舎が強い!

これは有力厩舎の若駒によく使える傾向で、例えば、A厩舎は1番目の素質馬は共同通信杯に使って2番目の素質馬は弥生賞に使う、一方でB厩舎は1番目の素質馬は弥生賞に使うから2番目の素質馬は共同通信杯に使う。だから共同通信杯ではA厩舎の馬がよく勝つみたいな傾向がよくあるんですよね。長期的に使える記事にしたいので具体的な厩舎名は出しませんが、厩舎である程度張るというのはクラシック期の世代戦なんかでは割とありかもしれません。

⑫このレースは関東馬が強い!

基本的には関西馬関東馬という実力関係になりますが(特にダート)、回収率ベースで見ると有意な差が見られることはほとんどありません。輸送技術の向上もありますし、あまり過去〇年で関西馬が〇勝というデータは好きじゃないですね。実際ここ最近その傾向が破られるレースが多くなってますし(フィエールマンの菊花賞がいい例)。

⑬このレースは〇〇牧場の馬が強い!

牧場でくくると母数が少なくなるので、あまりデータ的な有用性は無いように見えますが、ノーザンF関連の条件替わりなんかでは使えると思います。ノーザンFの馬は芝のクラシックディスタンスなんかでいくとベタ買いでいいラインなんですけど、芝短距離やダートでいくと勝率は悪くないものの回収率がイマイチなんですよね。その点「このレースはノーザンFの馬がイマイチ!」という傾向には結構妙味があるかもしれません。

⑭このレースは前走〇〇(レース名)の馬が強い!

ローテーション的な考察は一長一短で、最近のクラシックで行くと外厩の発達により前走から間隔を空けた馬が強いというデータが出ています(競馬はクラス分けされているので、基本的に先に勝った馬のほうが強い)。しかしその年によって同じレースであってもレースレベルはマチマチであるため、そこに全幅的な期待値上昇は望めないんですよね。参考程度に留めるのがいいでしょう。

⑮このレースは前走からの距離短縮馬が強い!

距離延長に関してはあまり聞きませんが、距離短縮に関しては傾向に出ていれば割と信用性は高いと思います。というのも基本的に(特に若駒では)芝もダートも長距離>短距離というレベル構成になりやすいです。距離が長いほうがレースレベルが高いのだから当然距離短縮馬のほうが強いはずで、一般的にそういう傾向があるということは覚えておいて損はないでしょう。

⑯このレースは前走〇着の馬が強い!

GⅠ経由の馬が強いレースで、前走着順の悪い馬が来やすいというのがあるかもしれませんが、基本的に度外視でいいと思いますね。ハナ差やクビ差で2着3着とかが変わってくるので、着順自体はあまり意味を持たないことが多いと思います。なんなら0.5差2着と0.5差11着は価値的に同じだったりするわけで。

⑰このレースはこれまで〇戦以上している馬が強い!

ダートの場合はレース経験の差というのは顕著に出てきます。あと芝のクラシック競走なんかでは使ったレース数が少なくフレッシュなほうが走る(順調に賞金加算できているため)というのは当然あります。明白なバイアスがあるなら使えるデータではないでしょうか。

⑱このレースは〇〇mを〇〇秒で走っている馬が強い!

タイムだけで議論するのは良くないですが、競馬予想における絶対指標として使えるものはタイムだけです。最近は芝のレースでも高速レースが展開されてタイムトライアル化してきていますし、追走能力という観点から見てもタイムを1つの指標にして絞るというのは有用性が高いのではないでしょうか。

⑲このレースは前走で上がり3位以内の馬が強い!

これも使えると思います。どの上がり順位の馬が3着以内に来るかというのは如実にレース質を表しますし、ある程度コースレイアウトにも依存してきます。もちろんレースラップ全体を見る必要性はありますが、それでも「上がり」というのは重要なファクターです。

⑳このレースは人気馬が強い!

これを最後に持ってきましたが、「過去〇年でこれだけ荒れているから今年も荒れる」というのは全く意味のない議論だと思いますね。荒れるか荒れないかはその年のメンバー構成に全依存するものですし、最近は東京などの広いコースでも極端な高速化の影響などで荒れやすくなりました。オッズ上位層が信頼できれば荒れませんし、オッズ上位層が信頼できなければ荒れます。そういう見方をすればいいわけで、過去の配当を考察する必要は全くないと個人的には考えています。

あとは同様に「このレースは〇人気が強い!」というのはさらに良くないと思います。そもそも1.3倍の1人気と4.1倍の1人気を同列に扱うデータに何の意味があるのかというのが正直感じるところですね。

長くなりましたがこんなところで。少なくとも傾向を見るうえでは過去10年分くらいのデータでは比較したいところですかね。母数が少ないと統計学的に優意性が得られません。ただ10年経てば競馬を取り巻く環境は大きく変わってくるわけで、10年前のデータを母集団に入れていいかという点にも疑問符が付きます(10年前に天栄なんか無かった)。

こういう風にデータの取捨選択をしていけば使えるデータは自ずと絞れて来ると思いますし、やはり目の前の情報を鵜呑みにするのではなく、きっちり1つ1つ精査していくことが、馬券的中に向けての近道となってくるのではないでしょうか。

というわけで週末の競馬予想も頑張っていきましょう。それではまた明日。