GB
ganbird.bsky.social
GB
@ganbird.bsky.social
株x機械学習
備忘録とモチベ維持が目的のアカウント
基本独り言ですがたまに関係ないことも話すかもしれません
この段階でよくわからないのがfeature_importanceで上位に来ている特徴量は1行ずつみたのだけど問題なさそうだったんですよね
November 7, 2024 at 3:22 PM
ばっさりいった結果
それっぽい数字に
リークしてるだろうで確定だと思うので絞り込みですな
November 7, 2024 at 3:20 PM
3で超ばっさりいってみますか
November 7, 2024 at 2:19 PM
困った
November 7, 2024 at 2:18 PM
2の結果。競馬場変更、距離も変更したけど似た傾向
November 7, 2024 at 2:18 PM
あきらかに性能が良すぎて、リークしてる可能性大。

なんだけれども、現状理由が見つからなくてとても困っているのがいま。

地道に探っていくしかないと思ってやっていくしかないですな
November 6, 2024 at 2:22 PM
特定条件下だけどもモデルの性能
November 6, 2024 at 2:20 PM
単勝オッズベースの性能
November 6, 2024 at 2:17 PM
alphaimpact.co.jp/2017/03/02/c...

alphaimpactさんの評価方法はなるほどなぁと思うので、これを手元のデータで表すと次のスレッドになる。
第7回 競馬予測を機械学習で解くための方法と評価方法
第7回目の理論記事では競馬をどのように機械学習問題に落とし込むのか、また学習した予測モデルの性能評価方法について説明していきます。 教師あり学習と教師なし学習 機械学習の問題は**教師あり学習(Supervised Learning)と教師なし学習(Unsupervised Learning)**の大きく2つに分類されます1。
alphaimpact.co.jp
November 6, 2024 at 2:15 PM
モデリング時に利用していない時系列のデータを予測させると

Accuracy: 0.79
AUC: 0.89

これは性能が良すぎる。
November 6, 2024 at 2:10 PM
日々の業務の合間の取り組みなので、すぐに間が空いてしまいその間に巻き戻ってしまうのよな

セーブポイント作っておきたいのと、モチベダウンを少しでも抑えるために。
November 6, 2024 at 2:05 PM