このプロジェクトは、4年前に作成された競馬予測ツールを最適化し、より高精度な予測を行うための改善を実装したものです。LightGBMモデルをベースに、最新の機械学習技術を適用して予測精度と回収率の向上を目指しました。
-
ハイパーパラメータの最適化
- Optunaを使用した自動最適化
- 重要なパラメータの調整
-
特徴量エンジニアリングの改善
- 他の競争馬との相対情報の追加
- 血統情報の効果的な活用
- 時系列特徴量の強化
-
データ処理の改善
- イレギュラーなレースデータの除外
- GroupKFoldを使用した適切なデータ分割
- 3着以内の2値分類による予測精度向上
-
モデル評価の改善
- 複数の評価指標の使用
- 特徴量重要度の可視化
model_improvements.py: 改善されたモデルのクラス定義test_improvements.py: テストと評価用のスクリプトIMPROVEMENTS.md: 改善点と効果の詳細な説明
lightgbm
pandas
numpy
matplotlib
scikit-learn
optuna
インストール方法:
pip install lightgbm pandas numpy matplotlib scikit-learn optuna
- 必要なライブラリをインストール
model_improvements.pyをインポートImprovedKeibaPredictionクラスを使用してモデルを構築・評価
詳細な使用方法はIMPROVEMENTS.mdを参照してください。
改善点と効果の詳細については、IMPROVEMENTS.mdを参照してください。