I'm Japanese. I'm interested in programming and AI.
Github: https://github.com/kajitaka1201
Note: https://note.com/kajitaka1201
プログラミング、AI系が好きです。
@kajitaka.bsky.social と同じ人です。そっちのアカウントでは、色々な人をフォローしたため、その方々のフォロワーの方がフォローしてくださっていて、これ自身は嬉しいのですが、趣味系の話を投稿する場所としては、あまりにもコミュニティーが大きすぎるため、この様な形で、新しいアカウントを作りました。
このアカウントでは、プログラミング、AI(基本的に文章生成)について、投稿する予定です。
電卓アプリに続き、「Todoアプリを作って。」という指示で、Canvasを使わせて、Todoアプリを作らせた。
* デザインは結構いい(分かりやすく、新しめUI)
* 追加や完了の機能も正常に動く
* 「完了済みを削除」を押すと完了にしたタスクが削除される機能付き
電卓アプリの時と同様、ウェブアプリのデザインは強め。速度も遅くない。
VibeCodingとか得意そう(GoogleがそういうIDEも作成していたくらいだし)。
電卓アプリに続き、「Todoアプリを作って。」という指示で、Canvasを使わせて、Todoアプリを作らせた。
* デザインは結構いい(分かりやすく、新しめUI)
* 追加や完了の機能も正常に動く
* 「完了済みを削除」を押すと完了にしたタスクが削除される機能付き
電卓アプリの時と同様、ウェブアプリのデザインは強め。速度も遅くない。
VibeCodingとか得意そう(GoogleがそういうIDEも作成していたくらいだし)。
ついに、Gmeini 3シリーズが出始めました
そのProモデルに、「電卓アプリを作って。」という指示で、Canvasを使わせて、電卓を作らせました(写真はスクリーンショット)
* デザインに大きな破綻なし
* 四則演算OK
* キーボードショートカット対応
* 浮動小数点数計算は問題が発生
* 0で割ったときには、Errorと出る
デザインなどに問題がないのは、ほぼまれで、速度も遅いという感じはしなかった。
1回目に、アイコン関連でエラーが発生していたが、自動でエラーを検知し、修正してくれた。
リーク通り、プログラミングの性能は高そう。
ついに、Gmeini 3シリーズが出始めました
そのProモデルに、「電卓アプリを作って。」という指示で、Canvasを使わせて、電卓を作らせました(写真はスクリーンショット)
* デザインに大きな破綻なし
* 四則演算OK
* キーボードショートカット対応
* 浮動小数点数計算は問題が発生
* 0で割ったときには、Errorと出る
デザインなどに問題がないのは、ほぼまれで、速度も遅いという感じはしなかった。
1回目に、アイコン関連でエラーが発生していたが、自動でエラーを検知し、修正してくれた。
リーク通り、プログラミングの性能は高そう。
AIを使用せずコーディングをしてみて、そこからプログラミングにおけるAIとの向き合い方について、個人的な感想をまとめてみたという内容です。
記事内にもある通り、「バイブコーディング編」(その名の通り、バイブコーディングを通して、この記事と同じことをするという内容)という記事を次に書こうと思っています。
note.com/kajitaka1201...
AIを使用せずコーディングをしてみて、そこからプログラミングにおけるAIとの向き合い方について、個人的な感想をまとめてみたという内容です。
記事内にもある通り、「バイブコーディング編」(その名の通り、バイブコーディングを通して、この記事と同じことをするという内容)という記事を次に書こうと思っています。
note.com/kajitaka1201...
* UIは独自に設計されていて、Chromeなどのシンプルなブラウザを使っている人からすると、少し慣れないといけない(いいか悪いかはその人次第)
* AIのエージェント機能は、複数画面を同時に操作していたりと、面白いが、性能はいまいち(途中まで正しかったのに結論が間違えていたり)
* AI機能は途中から有料
* 新規タブを開くときにわざわざ検索欄が出てきて入力しないといけないなど、若干使いにくい部分が存在
ちょっと使った感じの感想ですが、全体としては、AI機能は面白いが、普段使いは自分はしない、といった感じです。
fellou.ai
* UIは独自に設計されていて、Chromeなどのシンプルなブラウザを使っている人からすると、少し慣れないといけない(いいか悪いかはその人次第)
* AIのエージェント機能は、複数画面を同時に操作していたりと、面白いが、性能はいまいち(途中まで正しかったのに結論が間違えていたり)
* AI機能は途中から有料
* 新規タブを開くときにわざわざ検索欄が出てきて入力しないといけないなど、若干使いにくい部分が存在
ちょっと使った感じの感想ですが、全体としては、AI機能は面白いが、普段使いは自分はしない、といった感じです。
fellou.ai
電卓を、"Create a calculation app."という指示のみで作らせた。
* スピードは速い
* デザインに大きな破綻がない(最上位モデルでなく、破綻がないのは珍しいのでは)
* 四則演算などで、大きなバグはなさそう
* 演算記号を押した後も、もとの入力が保持されていて、同じ数が入る場合などでは、入力しずらい(9*9とか)
* 0で割ったときに、Infinityと出るが、その後は数字を入力したら、新しい計算が始まる
全体としては、一部使いづらい部分があったりするものの、結構いいし、スピードも速いので、プログラミングは強め。
電卓を、"Create a calculation app."という指示のみで作らせた。
* スピードは速い
* デザインに大きな破綻がない(最上位モデルでなく、破綻がないのは珍しいのでは)
* 四則演算などで、大きなバグはなさそう
* 演算記号を押した後も、もとの入力が保持されていて、同じ数が入る場合などでは、入力しずらい(9*9とか)
* 0で割ったときに、Infinityと出るが、その後は数字を入力したら、新しい計算が始まる
全体としては、一部使いづらい部分があったりするものの、結構いいし、スピードも速いので、プログラミングは強め。
数値上は、得点差が1点なので、逆転するかもしれないが、少なくとも、匹敵はしているのですごい。
そろそろGemini 3.0が出るという噂があるので、それがどうなるか。
数値上は、得点差が1点なので、逆転するかもしれないが、少なくとも、匹敵はしているのですごい。
そろそろGemini 3.0が出るという噂があるので、それがどうなるか。
プロンプトはGoogleが公開しているものを使いました。
現在少し問題となっている、ある企業のロゴっぽいものが生成される問題が発生したので、手動で編集してあります(白塗りしたため、若干違和感があると思います)
※生成AIの画像であり、販売するものではありません。
プロンプトはGoogleが公開しているものを使いました。
現在少し問題となっている、ある企業のロゴっぽいものが生成される問題が発生したので、手動で編集してあります(白塗りしたため、若干違和感があると思います)
※生成AIの画像であり、販売するものではありません。
今回は、PerplexityのAIブラウザCometを使用してみての感想と、AIブラウザについてです。
記事内にも書いてありますが、Cometの招待リンクを先日、ここ(Bluesky)で投稿しています(もしかすると、もう4つ全て使用されているかもしれません)。
note.com/kajitaka1201...
今回は、PerplexityのAIブラウザCometを使用してみての感想と、AIブラウザについてです。
記事内にも書いてありますが、Cometの招待リンクを先日、ここ(Bluesky)で投稿しています(もしかすると、もう4つ全て使用されているかもしれません)。
note.com/kajitaka1201...
1つにつき1人しか使用できないので、使用できない可能性があります。その際は、すみません。
また、数日かかるかもしれませんが、使用した感想をNoteにまとめる予定です。
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
1つにつき1人しか使用できないので、使用できない可能性があります。その際は、すみません。
また、数日かかるかもしれませんが、使用した感想をNoteにまとめる予定です。
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
* イメージは、Google版のPerplexityみたいな感じ。
* スピードは、思ったよりも速く、待つ感じはしない。
* 普通の検索にもすぐ飛ぶことができ、そこはGoogleらしいといった感じ。
* 日付は、IPアドレスから取得した大体の位置情報をベースに答えているらしい。
* 試した時は、画像などのアップロードは、UI自体はあるが、問題が発生したと言って回答が生成されない(何か制限があるのかも)。
精度は、もう少し使ってみないとわからないが、今のところ、大きなハルシネーションはなさそう。
* イメージは、Google版のPerplexityみたいな感じ。
* スピードは、思ったよりも速く、待つ感じはしない。
* 普通の検索にもすぐ飛ぶことができ、そこはGoogleらしいといった感じ。
* 日付は、IPアドレスから取得した大体の位置情報をベースに答えているらしい。
* 試した時は、画像などのアップロードは、UI自体はあるが、問題が発生したと言って回答が生成されない(何か制限があるのかも)。
精度は、もう少し使ってみないとわからないが、今のところ、大きなハルシネーションはなさそう。
GPT-5で9.9-9.11を計算するように言った結果が画像の通り。
間違った、-0.21という結果を出してきた。
ちなみに、Gemini 2.5 Flashは、-0.02というまた別の間違いを、Gemini 2.5 Proも-0.21という結果を出した。
LMArenaでも少しやってみたが、-0.21という結果を出すモデルもそれなりに存在することが分かった。
9.9と9.11の大きさの比較はできても何故か計算ができないモデルたち...
GPT-5で9.9-9.11を計算するように言った結果が画像の通り。
間違った、-0.21という結果を出してきた。
ちなみに、Gemini 2.5 Flashは、-0.02というまた別の間違いを、Gemini 2.5 Proも-0.21という結果を出した。
LMArenaでも少しやってみたが、-0.21という結果を出すモデルもそれなりに存在することが分かった。
9.9と9.11の大きさの比較はできても何故か計算ができないモデルたち...
いつも、こちらで投稿している電卓を作らせるやつを、ベンチマークみたいに明文化しました。
最新のGPT-5やClaude Opus 4.1の結果も載せていますので、是非ご覧下さい。
note.com/kajitaka1201...
いつも、こちらで投稿している電卓を作らせるやつを、ベンチマークみたいに明文化しました。
最新のGPT-5やClaude Opus 4.1の結果も載せていますので、是非ご覧下さい。
note.com/kajitaka1201...
* 9.11と9.9の大小比較は見事、失敗
* strawberryのrの個数の問題は成功
* 検索機能もあり、日本の首相は正解
スピードは速く推論モデルかも微妙で、性能もいまいちなので、GPT-5ではない気がする。
あったとしてもGPT-5 nano、もしくはOpenAIのオープンモデルとかでは(そもそもOpenAIのモデルかも不明だけど)。
Horizon BetaはOpen Routerで利用可能です。
* 9.11と9.9の大小比較は見事、失敗
* strawberryのrの個数の問題は成功
* 検索機能もあり、日本の首相は正解
スピードは速く推論モデルかも微妙で、性能もいまいちなので、GPT-5ではない気がする。
あったとしてもGPT-5 nano、もしくはOpenAIのオープンモデルとかでは(そもそもOpenAIのモデルかも不明だけど)。
Horizon BetaはOpen Routerで利用可能です。
本日、Rakuten AI OPTIMISMに行き、そこで、楽天AIを使用したため、追加で使用してみて、使用感などをまとめました。
note.com/kajitaka1201...
本日、Rakuten AI OPTIMISMに行き、そこで、楽天AIを使用したため、追加で使用してみて、使用感などをまとめました。
note.com/kajitaka1201...
ChatGPT agentが出ているのを見たが、個人的には、AIが全てタスクを完了させるものではなく、自分が主でAIは手助けの役割でタスクをやるようなやつが欲しい。
それこそ、コーディングにおけるGithub CopilotやGemini Code Assistみたいな感じ。
最近はAI自体の性能は良いので、簡単なタスクなら全てやらせても問題は起きないが、難しくなると問題を起こし始めたり、意図していたこととは違うことを始めたりするので、そこら辺を制御出来る機能があればいいと思う(エージェントだけど途中で口出せたり、そもそも手助けツールだったりみたいな感じで)。
ChatGPT agentが出ているのを見たが、個人的には、AIが全てタスクを完了させるものではなく、自分が主でAIは手助けの役割でタスクをやるようなやつが欲しい。
それこそ、コーディングにおけるGithub CopilotやGemini Code Assistみたいな感じ。
最近はAI自体の性能は良いので、簡単なタスクなら全てやらせても問題は起きないが、難しくなると問題を起こし始めたり、意図していたこととは違うことを始めたりするので、そこら辺を制御出来る機能があればいいと思う(エージェントだけど途中で口出せたり、そもそも手助けツールだったりみたいな感じで)。
自分のプログラミングにおいてのAIの使用法について書いてみました。
よろしければ、この投稿かNoteのどちらかで各々のAIの使い方についての意見を書いていただけれると、嬉しいです。
note.com/kajitaka1201...
自分のプログラミングにおいてのAIの使用法について書いてみました。
よろしければ、この投稿かNoteのどちらかで各々のAIの使い方についての意見を書いていただけれると、嬉しいです。
note.com/kajitaka1201...
プロンプトは前のNoteのものです。
得点は20点満点中18点だった。
* デザインが、若干ボタンの間などが分かりづらい。
* エラーが表示される方法が、今までにない方法で、また、個人的に気に入った(画像の通り)
* thinkingもないため、13.1sで完成した(めちゃくちゃ速い)。
全体としては、thinkingがなくても、それなりにプログラミングの能力があり、ちょっとしたことなら、直ぐに完成するので、役に立ちそう。
プロンプトは前のNoteのものです。
得点は20点満点中18点だった。
* デザインが、若干ボタンの間などが分かりづらい。
* エラーが表示される方法が、今までにない方法で、また、個人的に気に入った(画像の通り)
* thinkingもないため、13.1sで完成した(めちゃくちゃ速い)。
全体としては、thinkingがなくても、それなりにプログラミングの能力があり、ちょっとしたことなら、直ぐに完成するので、役に立ちそう。
プロンプトは前のNoteのやつです。
得点付けをすると、20点満点中17点。
* デザインは結構特殊だが、文字も見やすいし、何をホバーしているのかなどが分かりやすい。
* スピードは、Proよりは速いが、thinkingをオンにしているため、1分ほどかかる。
プレビューの時と同じく、それなりのプログラミング能力はありそう。
それなりに簡単なタスクで、Proほどの時間をかけたくないときには便利になりそう。
プロンプトは前のNoteのやつです。
得点付けをすると、20点満点中17点。
* デザインは結構特殊だが、文字も見やすいし、何をホバーしているのかなどが分かりやすい。
* スピードは、Proよりは速いが、thinkingをオンにしているため、1分ほどかかる。
プレビューの時と同じく、それなりのプログラミング能力はありそう。
それなりに簡単なタスクで、Proほどの時間をかけたくないときには便利になりそう。
プロンプトは前のNoteと同じもの。
Noteと同じ評価(プラスの得点なし)をすると、20点満点中19点。
* デザインが見たことのないもので、最新っぽい感じではないが、背景色と文字とのコントラストがちゃんと合って、文字が見えやすくなっている
* スピードは、thinkingで相当考えていることもあり、結構かかる(スピード重視用ではないのはプレビューと同じく)。
インターネットの意見を見ても、前のバージョンと大きな変化はないそうで、少し変更を加えて、正式版にしたといった感じだと思われる。
プロンプトは前のNoteと同じもの。
Noteと同じ評価(プラスの得点なし)をすると、20点満点中19点。
* デザインが見たことのないもので、最新っぽい感じではないが、背景色と文字とのコントラストがちゃんと合って、文字が見えやすくなっている
* スピードは、thinkingで相当考えていることもあり、結構かかる(スピード重視用ではないのはプレビューと同じく)。
インターネットの意見を見ても、前のバージョンと大きな変化はないそうで、少し変更を加えて、正式版にしたといった感じだと思われる。
速度はtokens per secondが266.3だったりする時もあり、相当速い。(比較対象:Flash実測値170.5)
日本語は若干表現がおかしいところが存在する。
よって、flash liteは、精度はあまり気にしないが、速度が重要というタスクにおいて、使うのが良さそう。
速度はtokens per secondが266.3だったりする時もあり、相当速い。(比較対象:Flash実測値170.5)
日本語は若干表現がおかしいところが存在する。
よって、flash liteは、精度はあまり気にしないが、速度が重要というタスクにおいて、使うのが良さそう。
プログラミングにおいてのAIの能力を比較しました。
よく、このアカウントでやっている電卓のタスクを難しくして、その出来を得点化してランキング付けしました。
note.com/kajitaka1201...
プログラミングにおいてのAIの能力を比較しました。
よく、このアカウントでやっている電卓のタスクを難しくして、その出来を得点化してランキング付けしました。
note.com/kajitaka1201...
いつもと同じタスク(プロンプトはいつもは日本語ですが、今回は英語で書きました)。
* デザインに大きな破綻はない(若干直せそうだが)
* 計算はちゃんとできる
* 0で割ると、エラーが出るが、エラーを表示する文字が多く、スタイルが壊れる
* 浮動小数点数への計算は表示上9桁に丸めているため、対策はされているが、"0.200000000"みたいな感じの結果となるので惜しい
* 速度は意味が分からないほど速い(2.26sで、速度は697tokens/s)
ちゃんとしたものが、数秒で出来るので、簡単なタスクにはめっちゃ役に立ちそう。
いつもと同じタスク(プロンプトはいつもは日本語ですが、今回は英語で書きました)。
* デザインに大きな破綻はない(若干直せそうだが)
* 計算はちゃんとできる
* 0で割ると、エラーが出るが、エラーを表示する文字が多く、スタイルが壊れる
* 浮動小数点数への計算は表示上9桁に丸めているため、対策はされているが、"0.200000000"みたいな感じの結果となるので惜しい
* 速度は意味が分からないほど速い(2.26sで、速度は697tokens/s)
ちゃんとしたものが、数秒で出来るので、簡単なタスクにはめっちゃ役に立ちそう。
いつもの電卓。
* デザインは問題はない(もう少し使いやすくは出来るが、及第点)
* 0で割ると、アラートが出てくる
* 浮動小数点計算は対応していない(写真の通り)
* かかった時間はthinkingを含めて51.1sで、特別速くもないが遅くもない
全体としては、それなりのプログラミング能力を持っていることは分かる(それ以上は、このプロンプトでは分からない)。
プロンプトも適当で、最新のモデルでは、基本的に合格してしまうので、新しいのを考えないと(キーボードショートカットの機能追加をお願いしたりとか?)。
いつもの電卓。
* デザインは問題はない(もう少し使いやすくは出来るが、及第点)
* 0で割ると、アラートが出てくる
* 浮動小数点計算は対応していない(写真の通り)
* かかった時間はthinkingを含めて51.1sで、特別速くもないが遅くもない
全体としては、それなりのプログラミング能力を持っていることは分かる(それ以上は、このプロンプトでは分からない)。
プロンプトも適当で、最新のモデルでは、基本的に合格してしまうので、新しいのを考えないと(キーボードショートカットの機能追加をお願いしたりとか?)。