思考訓練の競馬

私が学生時代愛用していた英語参考書のバイブル「思考訓練の場としての英文解釈」からの連想で名付けたサイト。

にほんブログ村 競馬ブログへ
にほんブログ村

【POG2020】ディープ産駒の成功パターンに当てはまる馬をピックアップ!


POGは自分であれこれ考えながら、いい馬を選ぶのが醍醐味だと思いますが、データに基づいていい馬を的確に拾い上げる誘惑にも駆られます。

以下の記事では機械学習初心者の吉田しげるがPOG予測に挑んだ記録があります。学習内容などの詳細はこちらでお読みください。



まだまだ不完全で未熟な予測ですが、POGで有益な情報も多く得られました。

今回の予測では「ディープインパクト産駒」限定のものです。
(データ対象はディープ産駒過去8世代 約1000頭)

ディープ産駒のPOG成功に重要なファクター



まずはどんなファクターが重要か、を数値化できます。

図1. ディープ産駒のPOGで重要なファクター
スクリーンショット 2020-05-28 22.37.12

もちろんこれ以外にも有用なファクターはあるでしょうが、私が取り込んだファクターの中では、

「調教師のPOG期間の重賞獲得賞金(過去5年)」
「兄弟5頭平均賞金」
「馬主のPOG期間の重賞獲得賞金(過去5年)」
「デビューする月」


などがより重要なファクターとして働くことがわかりました。


現時点で使えるデータでフィルタリング



初戦の馬体重や初戦時期などのデータは現時点では大半が得られません。
ですから、上記の予測に今時点で全ての馬をかけるわけにはいきません。

なので、重要だと判断されたファクターの値を満たす馬をピックアップしてみましょう。


今時点でも使えるデータのうち、重要度が高いと判断されたファクターを3つピックアップすると、

「兄弟5頭平均賞金」
「誕生日数」(誕生日を1月1日からカウントしたもの)
「母年齢」


この3つです。

この3つのファクターについて成功パターンに該当する馬を探しましょう。


まずは3つのファクターとPOG期間内の賞金にどんな相関関係があるのか視覚的に把握して必要があります。


1.兄弟5頭平均本賞金とその馬の賞金

スクリーンショット 2020-06-03 14.40.41

単位が見づらいですが、ちょうど兄弟馬賞金が1億円までにお宝は隠れてそうです。

また兄弟馬賞金が2000万円以下でもお宝はたくさんおり、兄弟馬の平均賞金については高ければ高いほどいい訳ではなさそうです。

やはり何頭も大物を産む母馬というのはごく少数で、平均に回帰するというスタンスが妥当かもしれません。

※兄弟馬平均賞金は、Targetで提供されていますが、その賞金額は現時点での値なので、デビュー前のデータとは等しくないことに注意ください。


2.誕生日数と賞金
スクリーンショット 2020-06-01 13.57.27

POG期間で2億以上稼ぐような超大物は1月1日から60日以内に生まれています。
人間でも同世代なら早生まれの方がいいことが多いと言われますが、それはディープ産駒とPOGの関係においても例外ではないようです。


3.母の年齢と賞金

スクリーンショット 2020-06-01 13.37.35

億単位で稼ぐ馬は、母が6歳から11歳に集中しています。ざっくりと若い母がいいと言えそうです。



ピックアップ

上記の相関関係から、高賞金獲得馬パターンでフィルタリングします。

せっかくですから、範囲を厳しめに設定しましょう。

・兄弟5頭平均賞金 : 7,000万円以下
・誕生日数: 60日以内
・母年齢 : 6〜11歳


これら3つの条件を同時に全て満たす馬に絞ります。

すると以下のように141頭登録されているディープ産駒から、33頭が抽出されました。



※兄弟5頭平均賞金が「−1」は、兄弟馬で出走がない場合あるいは初仔

サトノ冠名が多く含まれているあたり、馬選びの傾向が表れていますね。

ここから更なるふるいにかけるとすれば、図1でもっとも重要なファクターだった「調教師」データが必要です。しかし未登録の馬も多く、入厩先は予定段階のもので使いにくいです。

ならば、現時点で既に正式に入厩先が確定している馬に絞れば、近年では特に重要な早期デビューの期待も高いはずなので有効でしょう。



いかがでしたでしょうか?ディープ産駒に限定した情報ではありますが、POG馬選びの参考にしてもらえれば幸いです。

2020年新種牡馬のサンデーサイレンスのクロス位置別データ


デアリングタクトの2冠達成によって、日本競馬は本格的にサンデーサイレンスのクロス馬の時代に突入しつつある。

とゆうのもサンデーサイレンスのクロスを持つ馬自体は少なくとも2005年から出走している。

私のデータ管理が正しければ、チビキセキという馬がサイレントハンターとフジキセキを通じて、サンデー2×3を持ち2005年の九州産馬限定戦でデビューしている。

これが日本競馬で最初のサンデーサイレンスクロス馬の誕生であるはずだ。

そして、以下のグラフを見ていただくと分かるように、まさに2017年産の世代がこそが生産数の上でもサンデークロス馬の試金石でもあったのだ。

サンデークロス頭数の年別推移.001


まるでデアリングタクトの成功を予測したかのように、2018年産では爆発的にサンデークロス馬が増加し、大台の1000頭以上が生産されている。

主に今年の新種牡馬によるところが大きいが、POGで役立つかは不明だが種牡馬の世界のストーリーを補う意味でも以下のサンデークロス位置別データは役立つかと思う。


新種牡馬とサンデークロス位置.img.001


主な新種牡馬のサンデークロス位置別の頭数だが、まず気がつくのはモーリス、リオンディーズ、ラブリーデイなどの4代目にサンデーを抱える種牡馬のサンデークロス馬の割合の高さだ。

やはり4代目にあれば気兼ねなく、インブリードできるという事なのでしょう。
ただ、4×3が4×4よりも多くなっており、この形への信頼は生産界では依然高いのかもしれない。もちろん4代目にサンデーを抱える繁殖牝馬が相対的に少ない事もあるだろう。


対して、注目のドゥラメンテ産駒はそもそもサンデークロス馬が4分の1程度で、やはり3代目にサンデーを抱える点から敬遠された事が読み取れる。


今年の目玉とされるモーリスとドゥラメンテだが、サンデークロスという点から見れば、かなり異なる条件での争いという事になる。


桜花賞の予想アプローチ

2687DDED-C655-4C0B-BF48-E73D90253E79

桜花賞は、マイルのG1であること、3才春であるがゆえに、早熟性とマイラー性が重要になる。

だからこそ、日本のG1で最もダイワメジャー産駒についての理解力が問われるレースだと言える。

ダイワメジャーが勝つパターン


ダイワメジャー産駒は重賞36勝のうち、50%以上が1600mで、4コーナー3番手以内での勝利が約64%を占める。また2才限定戦での重賞勝利が最も多くを占める。

ダイワメジャーのホットポイントを一言で言えば、世代限定戦×マイル×先行だ。

ゆえに桜花賞でのダイワメジャー産駒は非常に重要になる。

桜花賞とダイワメジャー



◇桜花賞(外回り13R)_馬連、馬群スカスカ度、ペース評価
スクリーンショット 2020-04-10 12.47.36

(ペース:独自に評価
馬群スカスカ度:残り600m地点でのタイム差の標準偏差)


◇で示した画像でオレンジの色がついているのが、ダイワメジャー産駒が馬券のカギとなった4レースだ。

Case1.ハイペースでダイワメジャー輝く

ダイワメジャー産駒がマイルで先行して勝つときは、ディープやハーツクライとは対照的に持続力勝負への強さが発揮される時だ。

そのためにはペースが流れる必要がある。レーヌミノルの勝利は典型的。アユサンの桜花賞は3着プリンセスジャック(14人気)が台頭。いずれもハイペース。


Case2.スローペースでダイワメジャー沈む

ジュエラーの桜花賞は、1番人気メジャーエンブレムがスローペースを中団待機して切れ負け。次走NHKマイルでは持続ラップを自ら作り、逃げ切り勝ちしたのは対照的。


グランアレグリアの桜花賞で2着したシゲルピンクダイヤは切れ味を生かす馬でダイワメジャーの理解としては例外的で度外視していいだろう。

今年は混戦メンバーだが、やはり注目ポイントはレシステンシアだろう。

Case1かCase2か、すでに阪神JFとチューリップ賞で両パターンを経験して、見事にダイワメジャー的であることを証明してくれている。


その2パターンがあることを理解しただけでは、馬券を買うにあたっては十分ではない。

ダイワメジャー
上記の3レースを参考にすれば、レシステンシアの取捨のヒントが得られる。

レーヌミノル 人気薄→ハイペースを利する
プリンセスジャック 人気薄→ハイペースを利する
メジャーエンブレム 1人気→スローペースで沈む


レシステンシアは確実に上位人気で、メジャーエンブレムの二の舞がよぎる。人気を背負っていれば、理想の競馬への妨害工作も生まれてくる。人気を背負いながら、マイペースを作るというのは容易ではないだろう。

今年の場合はさらにミヤマザクラが人気馬で先行馬ということでさらに問題は複雑だ。

論理的にCase1かCase2を予測することは非常に難しいが、予想のポイントはこの先行勢の駆け引きだろう。

ブラストワンピースの個性を馬群密集度から分析する

IMG_1610


ブラストワンピースは非常に特徴的な馬だ。

成績を見れば(7−0−0−6)と勝つか負けるかがハッキリとしているのだ。

言いかえれば、得意なパターンと苦手なパターンもハッキリしている。

あの大きなアクションゆえに、器用さに欠ける点が問題の根本にあると考える。

大阪杯では2年連続で人気を裏切る形となったが、今年の場合、競馬メディアの結果分析はポジション取りの話題が大勢を占めた。

ペースが落ち着き、馬群が凝縮して外を回す馬には勝負にならないレース、これがブラストワンピースにとっては最も持ち味が活かせないパターンであることは多くの人が認識しているはずだ。


しかしそれを数値化して、客観的に評価できている人はいないのではないか?


ということで、馬群密集度なるものを、近似的に数値化してみたいと思う。


馬群密集度の算出法は後にして、まずはこちらの画像をみていただきたい。

ブラストと馬群.001

決して、単純に馬群密集度と勝ち負けが相関しているわけではないが、有効な学びは得られそうだ。


馬群密集度は非常に簡単で、
(走破タイム)ー(上がり3Fタイム)から、残り3F地点での各馬のタイムを出し、それらの標準偏差をとっている。(厳密には不偏推定量)

つまり、残り3F地点での各馬の前後のポジションの散らばりを算出している。ここではそれを馬群密集度と呼ぶことにする。


すると、ブラストワンピースの唯一のG1勝利である有馬記念が馬群密集度で最も高い値をとる。
つまり、馬群が最も散らばっていたということだ。馬群が散らばっているということは、広いスペースが生まれ、アクションの大きいブラストワンピースが悠々と走れるのだ。


逆に馬群密集度の低い所に目を向けると、2度の大阪杯が連ねる。ともに有馬記念と比べれば、低い馬群密集度で敗戦している。
ペースが遅く、馬群が密集する度合いが高くなる中で、ストライドロスなく加速しようと思えば、外を回すのは合理的だが、それではG1を勝てないということだ。

確かに毎日杯は、最も馬群密集度が低い中で勝利を挙げているが、相手関係の問題もあるし、あの時は最内枠から終始好位2番手を確保できた。2番手にいれば、全体の馬群密集度が影響しづらいこともある。


ちなみに、画像のRPCIという値はペースの指標と思ってもらうといい。値が大きければ上がり重点のレース、値が小さいと持続的なペース。


最後に、ブラストワンピースの好走ポイントをまとめておく

《ペースが速く持続戦になった上で、馬群密集度が低いレース》



サンデーサイレンスのクロスの効果を全データから検証

サンデークロスBlogサムネ.001

サンデーサイレンスのクロス・インブリードについて、あらゆるデータを紹介する。
(データはいずれも2020.05.25時点でのもの)

POGでも一口馬主でも生産においても、サンデーサイレンスのクロスの効果は理解しておく必要があるだろう。デアリングタクトの2冠達成を受けて、2020/05/25にデータを更新し、新たに修正・加筆した。

まず問題意識として、サンデーサイレンスのクロスを論じる時に数頭だけをピックアップして、全体を無視した議論が多い。

その原因はサンデーサイレンスのクロスの保有馬を全て抽出し、データ分析することが容易ではないからだろう。


本記事では、そこを乗り越えてTargetとnetkeibaとPython(プログラミング言語)の協力プレイで、サンデーサイレンスのクロス馬全てを対象にデータを紹介する。

主なトピックはこちらです。

  • サンデーサイレンスのクロス保有馬は何頭いるか?
  • サンデーサイレンスのクロスの代表馬
  • クラス別成績
  • 種牡馬別の成績
  • クロスの位置別の作用

サンデーサイレンスのクロス保有馬は何頭いるか?


そもそもサンデークロス保有馬が何頭いるかという話。


グラフ作成場所.001



3歳以上の血統登録馬に限るが、1136頭いる。思ったよりも多い印象ではないだろうか。

そしてそのうち出走までこぎつけたのが1072頭。
さらにそのうち1勝以上した馬が234頭で、勝ち上がり率は21.8%。

サンデーサイレンスのクロスの代表馬


サンデークロス記事_添付画像.002



こちらは本賞金順なので、キャリアの長い馬が上位に来るために高齢馬が多くなっているが、デアリングタクトはG12勝し、一気にサンデークロス馬の代表馬となった。

クラス別成績


やはり気になるのが、サンデークロスでどこまで大きなところが狙えるのか。

サンデークロス記事_添付画像.003


つい最近まではG2以上での勝利はなかったが、やはり時間の問題だったようでしっかりとG2以上でも結果が出てきている。

種牡馬別の成績


具体的に配合を考える時に、サンデーサイレンスのクロスと一口に言っても種牡馬によってもその効果は異なるだろう。なので、サンデークロス馬の成績を種牡馬別に見てみよう。

サンデークロス記事_添付画像.004

(データは勝利数の多い種牡馬TOP10)

 勝利数ではスクリーンヒーローが1位、以下エピファネイア、アドマイヤムーン、オルフェーヴルと続く。

1走当賞金ではエピファネイアとオルフェーヴルが高く、まさに本格的にサンデーサイレンスのクロス時代に入った事を予感させる。

馬券に絡む確率で見ても、エピファネイア産駒とオルフェーヴル産駒が頭ひとつ抜けている。

また上位が母方にサンデーサイレンスを保有する種牡馬(黄色)が占め、父方にサンデーの血を引く種牡馬(無色)は比較的成績が悪いのも特徴として読み取れる。

クロスの位置別の作用


最後になかなか集計の困難なクロスの位置ごとの成績を紹介したい。

つまり3×3とか4×3など、クロスの度合いによる効果の違いをみる。

サンデークロス記事_添付画像.005


※サンプル数が一桁のものは省略
※4×3の表記は父方の4代目と母方の3代目を指している
※netkeibaをPyhtonでスクレイピングしたデータ 1136件中3件の欠損値がある

平均賞金で測ると、サンデー3×4とサンデー3×4が他よりも高く、それ以外はどれも大きな差はない。

インブリードやクロスは濃過ぎてもハイリスクという心配が生じるが、確かに今のところ2代目にサンデーを有するクロスパターンの平均賞金は低い。ただサンプル数が非常に少ないことから、判断は待ちたい。

一応、血量ごとの成績も示しておこう。

サンデークロス記事_添付画像.006


37.5%が賞金で高く出ているが、これはアドマイヤドバイが引っ張っているもので必ずしも有効なクロスとは断定できない。

やはりサンプル数としては、25.0%(3×3)と18.75%(3×4、4×3)が大半を占めるわけだが、デアリングタクトの成功の影響が大きく18.75%、いわゆる奇跡の血量が最もいい数値となっている。



データの紹介はここまで。

他の種牡馬との比較など、より深い検証の余地がありますが、それは今後の課題としたい。


また、サンデーサイレンスのクロス保有馬のTargetにおける抽出方法については、需要があればコメントくださいませ。改めて記事に書きますので。


Twitterでは毎週サンデーサイレンスのクロスパターン別成績を更新中



Ad