Mitecat
@sudoms.bsky.social
Researcher | Ph.D. in Agriculture | He/Him | Population Ecology, Applied Statistics, Machine Learning, Tea Pest Management | https://orcid.org/0000-0001-9834-9857 | https://github.com/sudoms | https://sudori.info/
特にニューラルネット関連の分野は明らかに査読が追いついていなくて、
プレプリントと実装を公開
→自分や他の研究者がそのコードを改良して新規手法を公開
→さらに改良手法を公開
で数週間おきにSOTAが更新される、MUSASHI -GUN道-の「落ちながら戦ってる…」みたいな状況が普通に存在する。
査読前のプレプリント公開が存在しなかった世界には今さら戻れないだろう。
プレプリントと実装を公開
→自分や他の研究者がそのコードを改良して新規手法を公開
→さらに改良手法を公開
で数週間おきにSOTAが更新される、MUSASHI -GUN道-の「落ちながら戦ってる…」みたいな状況が普通に存在する。
査読前のプレプリント公開が存在しなかった世界には今さら戻れないだろう。
November 10, 2025 at 3:29 AM
特にニューラルネット関連の分野は明らかに査読が追いついていなくて、
プレプリントと実装を公開
→自分や他の研究者がそのコードを改良して新規手法を公開
→さらに改良手法を公開
で数週間おきにSOTAが更新される、MUSASHI -GUN道-の「落ちながら戦ってる…」みたいな状況が普通に存在する。
査読前のプレプリント公開が存在しなかった世界には今さら戻れないだろう。
プレプリントと実装を公開
→自分や他の研究者がそのコードを改良して新規手法を公開
→さらに改良手法を公開
で数週間おきにSOTAが更新される、MUSASHI -GUN道-の「落ちながら戦ってる…」みたいな状況が普通に存在する。
査読前のプレプリント公開が存在しなかった世界には今さら戻れないだろう。
個人的な嗅覚で語らせてもらうと、Qwen Image にはおそらく適切なプロンプト・エンジニアリングの技法が存在しており、これが知識化された段階で「使える」モデルになるだろう。
しかしモデルが巨大で 1 枚ずつの出力に時間を要するため、現状ではユーザーコミュニティによる試行錯誤とノウハウ共有が立ち遅れている。
しかしモデルが巨大で 1 枚ずつの出力に時間を要するため、現状ではユーザーコミュニティによる試行錯誤とノウハウ共有が立ち遅れている。
October 20, 2025 at 4:30 PM
個人的な嗅覚で語らせてもらうと、Qwen Image にはおそらく適切なプロンプト・エンジニアリングの技法が存在しており、これが知識化された段階で「使える」モデルになるだろう。
しかしモデルが巨大で 1 枚ずつの出力に時間を要するため、現状ではユーザーコミュニティによる試行錯誤とノウハウ共有が立ち遅れている。
しかしモデルが巨大で 1 枚ずつの出力に時間を要するため、現状ではユーザーコミュニティによる試行錯誤とノウハウ共有が立ち遅れている。
なおかつ、たとえ適切な潜在空間に接近できるプロンプトに行き当たったとしても、必ずしもいい感じの結果が得られるわけではない。出力画像サイズの設定、拡散ステップ数、CFG値といった値に依存して、特定のパラメータ範囲の組み合わせでしかプロンプトが効かないことがある。
まあ Stable Diffusion もその傾向は多少あるのだけど、あちらはモデルサイズがそこまで大きくないので、RTX 3090 クラスの GPU があれば xyz plot でパラメータ空間を一括して掘る事が可能だった。
まあ Stable Diffusion もその傾向は多少あるのだけど、あちらはモデルサイズがそこまで大きくないので、RTX 3090 クラスの GPU があれば xyz plot でパラメータ空間を一括して掘る事が可能だった。
October 20, 2025 at 4:30 PM
なおかつ、たとえ適切な潜在空間に接近できるプロンプトに行き当たったとしても、必ずしもいい感じの結果が得られるわけではない。出力画像サイズの設定、拡散ステップ数、CFG値といった値に依存して、特定のパラメータ範囲の組み合わせでしかプロンプトが効かないことがある。
まあ Stable Diffusion もその傾向は多少あるのだけど、あちらはモデルサイズがそこまで大きくないので、RTX 3090 クラスの GPU があれば xyz plot でパラメータ空間を一括して掘る事が可能だった。
まあ Stable Diffusion もその傾向は多少あるのだけど、あちらはモデルサイズがそこまで大きくないので、RTX 3090 クラスの GPU があれば xyz plot でパラメータ空間を一括して掘る事が可能だった。
まあリングに手を置いて回すのと、どちらがオペレーションとして速いかは用途次第ですが、AFを信頼できるのであればアリかと思います。
October 19, 2025 at 4:31 PM
まあリングに手を置いて回すのと、どちらがオペレーションとして速いかは用途次第ですが、AFを信頼できるのであればアリかと思います。