りくは@雷検定4.5級
rikuha.bsky.social
りくは@雷検定4.5級
@rikuha.bsky.social
98 followers 130 following 1.5K posts
軸索と樹状突起が生えたコンセントです. 趣味で生きてる. 好き, 天/脳/Rust/テーブルゲーム/社会構成主義/これを読んでる貴方 etc.. 嫌い,Windows/ネタバレ/リョナ/青甲羅/動く点P/動的型づけ言語/Windows エセ脱二分法主義者. 絡んでくれる人好きよ.
Posts Media Videos Starter Packs
Pinned
太ももよ。脂肪を抱け。

〜フトモモ・ライーク博士〜
うーん. シンプルにGPT-5, 使い物にならない気がしてきた.

Playgroundのほうはもうちょっといい感じに動いてくれてた気がするんだけどな.

ということは, Codexようにプロンプトが仕込まれてて, そのプロンプトが悪さしてるんかな. そんな気がする.
- 幻覚がひどい. 嘘の情報が多い

- 間違いを指摘しても適切に自分の間違いを理解しない. あるいは認めない

- 提案してとか, アイディアを出してとか, そうした理由なに?とか, そういうAskをしてるのに, ファイルやコードをすぐに書き換えたがる

- 勝手なことをしがち. オリジナルに沿わない. プロンプトに沿わない.

結果として, Claudeの方が性能がいい. だが, Claudeが制限に達しやすいのに対してGPTは制限がゆるい.

サブスクは同じ金額だが, その性能差と制限差で, Claudeは高品質高価格, GPT-5は低品質低価格という状況
Claude Sonet 4.5とGPT-5をつかいくらべてわかったこと.
(Claude code v.s. codex)

圧倒的にClaudeの方が仕事ができる.

いま, 論文をマークダウン形式にしたものがあって, それを今後の処理のためのTypstに変換させているのだが, GPT-5だと

- 勝手に内容を書き換える. 要約したり言い換えたり.

- 数式の書き方が間違ってる
+ マークダウン内のTeXの書き方に沿ってない
+ カンマとピリオドの使い方が論文として正しくない
+ 複数行を使わない
+ 不適切なところでインラインにする
x.com/173__inami/s...

これも声を大にして言えないけど………

これ合理的に考えて間違ってないんだよな…
モヤモヤするけど。そんなところにまでガードレールを敷くの間違ってるだろって気持ちも出る。

でも、この考えが一般化したほうが、浮気や不倫は減るだろうし、不必要に怪我することも関係を悪くすることもないから、デメリットよりメリットの方が勝りそう。

だから、非常に僕は認めたくないけど、合理的に考えたら良い提案だと思う。
173 on X: "これ結構認識できてない人多そう https://t.co/iC7RYRkIbk" / X
これ結構認識できてない人多そう https://t.co/iC7RYRkIbk
x.com
x.com/ngs_1129/sta...

うーん。あんまり声を大にして言えないんだけど、いい関係とは思えないんだよなぁ…

この、連絡も愛情表現も最低限でいいっていうタイプ。

もちろん、いろいろタイプはあって、完全に信用を置いててとか、最低限が十二分で不安にならないとか、そういう関係が良好な上でそうなってるならいいんだけど…

最近は、自分の時間とか、多様性とか、価値観は人それぞれとか、そういう言説が流行りすぎて、関係を大切に育てるっていう大事な価値観が失われつつあるから。

主語が私のままで、私達にならない人達は、単純に自己中なだけという…
凪沙 on X: "彼氏からの連絡が最低限でも、愛情表現が少なくても大丈夫な人っているじゃん どういう環境で育つとそうなるんだろ? 強がってるとかじゃなく、ほんとに大丈夫な人居るじゃん 自分の時間の使い方がうまいのかな" / X
彼氏からの連絡が最低限でも、愛情表現が少なくても大丈夫な人っているじゃん どういう環境で育つとそうなるんだろ? 強がってるとかじゃなく、ほんとに大丈夫な人居るじゃん 自分の時間の使い方がうまいのかな
x.com
うん…

たぶん北海道だから、速達で午前に出しても翌日の遅くについてしまって、処理も次の日に持ち越されたりしてなんだと思う。

休日も含んだらなおさらで、速達つけても1日差しかなさそう。北海道からだと
たぶん、fansferには速達で出してもほぼ変わらないんだろうな。

いい実験になった。

いざとなったら速達でなんとかなるだろって思ってたのは甘い考えだったのがわかった。
11/1に速達で出したものが、今日の18時に受け取られた事になった。

うーん。届いた当日か翌営業日とのことだったが、なら昨日届いたことになるよね。

うーん。11/1で土曜日。11/3で祝日の月曜だから、11/4か11/5には届いてるってことで、まぁ、11/5と見れば辻褄は合うのか?

うーん。11/4に届いてるものな気もするけどなぁ。
うーん. LLMの出力する文章やコードが基本的に質が悪く感じる.

ロジックが破綻してるんだよね. そのテキストの背景やストーリーが崩れてるという感じ.

でも, 思うに, これはLLMの性能の問題でも技術の課題でもなく, 多くの人間はそんなにちゃんとした文章やコードを書いていないだけなんだという気がする.

すなわち, 有象無象の人たちの文章がごちゃまぜになってるデーターセットだから質がめちゃくちゃ悪いんだろう.
うそ.... だろ....
gpt-5があまりにもおバカちゃんすぎる....
claude, おまえ, そんなに優秀だったのか...

案だししてといったのにも関わらず書き換えてくるし, 詳細な状況を伝えたのにも関わらずそれを忘れておかしなこと書くし....

こんなに性能差があったのか..
決めた. 大事な事は普段どおり, あるいは普段の状況と限りなく近い状態に落とし込んでから取り組もう
最悪だ. なんにも頭に浮かばない.
さすがにこの性能はキツイ…

そうはならんやろ過ぎる。gpt5でこれというのがひど過ぎる……

え、claudeから乗り換えようか迷ってたけど、claudeを使い続ける方が吉なのか…?
かなしいっぴ
ないちゃいそうだっび
もう, だいぶ時間が立ってるのに全うにClaudeとChatGPTを評価してる日本語の記事が存在しないの, とても平和ボケを感じる.
博士、ポスドクにありがちなこと。

研究と勉強をしていない瞬間がほぼない。

土日祝とか関係ない。研究をしない日はない。

働く時間なんてない。基本的に1日中研究。

苦しい。

なんだかんだ楽しい
かなりボロボロになりながらやったのに、無駄になりそうなの、悲しくて仕方ない。

悲しんでもしょうがないからリカバリを考える。
Claude Codeの週制限, 5%の人のみって話だったから気にしてなかったけど, 3日で50%いってる... 大丈夫かなぁ...

OpenAIに乗り換えるか, だいぶ悩み. Open AIすきじゃないんだけどなー.

Open AIの誰もがクリエイティブになれるって思想が僕と合わない. それは, 単純作業が好きって人を抑圧する, 画一化を進める思想だから. そういうのは多様であっていいと思うんだ.

創造的なことが好きな人, モクモクとやるのが好きな人. どっちがいても良いのに後者を弾圧するような思想だから, 好きくなれない.
claude codeがquestionsなるものを出してくるようになった. とてもいい. これ.
論文高いお
泣きそうだお
風強すぎて空飛べそう。てか、飛んだ。