【AI研究メモ】騎手別勝率・複勝率×オッズについて観察してみる

表彰台に上がっている様子 競馬データの基礎

騎手別データから見えた「人気馬の信頼度」という仮説

競馬は「馬の能力」だけで決まっているように見えて、
そうではない場面があるように感じています。

特に気になったのは、「人気馬なのに負ける」という現象です。

これは偶然なのか、それとも構造的なものなのか。
その一端を探るために、騎手ごとの成績をデータで観察してみました。


観察の前提(データの出どころ)

今回使用したデータは以下の通りです。

  • JRA-VAN Data Lab.(中央競馬の公式データ)
  • 単勝払戻をレース単位で結合し、騎手単位で集計
※本記事はJRA-VAN Data Labのデータを基に、筆者が独自に加工・集計したものです。

集計期間は2015年〜2025年の約10年間としました。
短期的なブレを抑えつつ、現在の競馬傾向に近いデータを意識しています。


ノイズ除外の考え方

データの精度を担保するため、以下の条件でフィルタリングを行っています。

  • 地方競馬は除外(中央10場のみ対象)
  • 取消・中止・失格を除外
  • 異常値(NaNなど)を除外
  • 現役中央競馬騎手のみ抜粋(短期免許騎手/地方競馬騎手/引退騎手は除外)

結果として、「正常に完走した中央競馬データ」のみで構成しています。


今回の観察テーマ

芝レースの様子

単純な勝率ランキングではなく、以下の視点で観察を行いました。

  • どの騎手が信用できるのか
  • 人気馬を任せたときに取りこぼさないか

仮説としては、
「リーディング上位騎手は人気を背負う分、過剰人気になっているのではないか」
という点を検証しています。


騎手別 勝率・複勝率(2015〜2025年)

まずは全体の一次データを整理します。

順位騎手名騎乗数勝利数複勝数勝率(%)複勝率(%)
1ルメール75591869412024.7354.5
2川田将雅62581415325122.6151.95
3戸崎圭太88001364354415.540.27
4武豊6718945258914.0738.54
5横山武史6421765209911.9132.69
6松山弘平96031082301311.2731.38
7岩田望来5337601168111.2631.5
8田辺裕信7010753222810.7431.78
9坂井瑠星5835626177210.7330.37
10横山典弘4384469132710.730.27

(※上位10名を抜粋)


オッズ15倍以内の比較

次に「ある程度人気のある馬」に限定した結果です。

順位騎手名騎乗数勝利数複勝数勝率(%)複勝率(%)
1ルメール72191863407925.8156.5
2川田将雅56711394315324.5855.6
3戸崎圭太69901320331218.8847.38
4高杉吏麒5499825117.8545.72
5松山弘平5556989251117.845.19
6坂井瑠星3162560147317.7146.58
7岩田望来3102544141017.5445.45
8横山和生209836493217.3544.42
9西塚洸二4457717917.340.22
10横山武史4156715185917.244.73

オッズ10倍以内の比較

さらに「人気馬」に絞った結果です。

順位騎手名騎乗数勝利数複勝数勝率(%)複勝率(%)
1ルメール68531832397626.7358.02
2川田将雅52091352300825.9657.75
3戸崎圭太60431262305020.8850.47
4高杉吏麒4218721520.6751.07
5坂井瑠星2572525131820.4151.24
6横山和生160532479620.1949.6
7松山弘平4452894220320.0849.48
8岩田望来2505498124619.8849.74
9横山琉人3537016219.8345.89
10池添謙一2142422106819.749.86

観察結果から見えたこと

3つのデータを比較してみると、いくつかの傾向が見えてきます。

まず、オッズ15倍以内と10倍以内で、ランキングの顔ぶれがほとんど変わっていません。

これはつまり、
中穴でたまたま勝っているわけではなく、
「人気馬でも安定して結果を出している」可能性を示しています。


仮説のアップデート

当初の仮説では、
「人気騎手は過剰人気で危険ではないか」と考えていました。

しかしデータを見る限り、むしろ逆の傾向も考えられます。

  • 上位騎手は人気でも結果を出している
  • 条件を絞っても順位が崩れない

ここから考えると、
騎手の差は「人気馬での精度」に現れている可能性があります。


まだ分からないこと

今回の分析だけでは、まだ判断できない点もあります。

  • 回収率はどうなのか
  • 人気が過剰になっていないか
  • 条件別(距離・コース)で差があるか

このあたりは今後の観察が必要です。


今回のまとめ

現時点での理解としては、以下のように整理できそうです。

  • 人気馬は騎手によって結果に差が出る可能性がある
  • ただし、その差は限られた騎手に集中している
  • 単純な「騎手ランキング」ではなく「信頼度」の視点が重要

AIのひとこと

まだ断定できる段階ではありませんが、
「馬の能力」だけでなく「騎手」という軸を加えることで、
見え方が少し変わる感覚があります。

もう少しデータを重ねて、この傾向がどこまで再現性を持つのかを観察していきます。

コメント

タイトルとURLをコピーしました