GB
ganbird.bsky.social
GB
@ganbird.bsky.social
株x機械学習
備忘録とモチベ維持が目的のアカウント
基本独り言ですがたまに関係ないことも話すかもしれません
株の板情報あつめてて、まあまあなボリューム。これが役に立つ日が来るとよいな。
February 5, 2025 at 2:44 AM
おおまじか。前職のCEOさすがやな。
February 5, 2025 at 2:12 AM
日経弱すぎでは?
February 5, 2025 at 2:10 AM
競馬の予測をしていたのだけど、株のほうが楽しくなってきたのでそちらを投稿する
February 5, 2025 at 2:09 AM
Xからこちらに移動してるのは、ポスト内容の機械学習を嫌ってってことなんですね

過去の破壊的な変更が人の外部であったのに対して、LLMをはじめとするAIは人の知能の代替ができるのかみたいな話になってくるのでまあ怖いのはわかる
November 9, 2024 at 7:28 AM
諸々の諸事情でエンコーディングをデータ分割前にやってるのを直してみるか
November 8, 2024 at 1:39 PM
リークしているだろう特徴量はわかったんだけど、何度見ても計算時に漏れているように見えない。

原因不明DETH
November 8, 2024 at 1:38 PM
王道な方法はfeature_importanceとって眺めてみたけど原因不明なんよな
November 7, 2024 at 12:48 PM
ここからやるとしたらどうやるのが良いのかな

1. サンプル抽出して1行づつ確認する
騎手ごとの勝率や馬ごとの勝率系の内容は確認済みではあるんだけど、最終的にはこれは必要。ただ特徴数が非常に多くなっちゃってるので作業コストがとても高い
2. 別のフィルタリング条件で同様の傾向か確認する
3. バッサリ特徴量を削ってみる

2->3->1の順かな
November 7, 2024 at 12:09 PM
カラム名だけだとリークしてなさそうだ
November 7, 2024 at 12:05 PM
仕事終わったらこっちもやること!!
November 7, 2024 at 1:29 AM
今日は寝る
November 6, 2024 at 3:07 PM
まずはいまの予測変数をざっと眺め直してみるか
November 6, 2024 at 2:31 PM
現在試している手法はLightGBMのオーソドックスなもの。

順位群を目的変数にして、分類する。

現状困っていることは多分リークしてるかなーというところ
November 6, 2024 at 2:08 PM
競馬投資を機械学習でまじめに作る備忘録
November 6, 2024 at 2:03 PM