Kajitaka
kajitaka.bsky.social
Kajitaka
@kajitaka.bsky.social
プログラミング、AI系が趣味の日本人です。
I'm Japanese. I'm interested in programming and AI.

Github: https://github.com/kajitaka1201
Note: https://note.com/kajitaka1201
Pinned
簡単な自己紹介です。
プログラミング、AI系が好きです。
@kajitaka.bsky.social と同じ人です。そっちのアカウントでは、色々な人をフォローしたため、その方々のフォロワーの方がフォローしてくださっていて、これ自身は嬉しいのですが、趣味系の話を投稿する場所としては、あまりにもコミュニティーが大きすぎるため、この様な形で、新しいアカウントを作りました。
このアカウントでは、プログラミング、AI(基本的に文章生成)について、投稿する予定です。
FellouというAIブラウザを試してみた。

* UIは独自に設計されていて、Chromeなどのシンプルなブラウザを使っている人からすると、少し慣れないといけない(いいか悪いかはその人次第)
* AIのエージェント機能は、複数画面を同時に操作していたりと、面白いが、性能はいまいち(途中まで正しかったのに結論が間違えていたり)
* AI機能は途中から有料
* 新規タブを開くときにわざわざ検索欄が出てきて入力しないといけないなど、若干使いにくい部分が存在

ちょっと使った感じの感想ですが、全体としては、AI機能は面白いが、普段使いは自分はしない、といった感じです。

fellou.ai
Agentic AI Browser for Deep Search & Automation | Fellou
The world's first agentic AI browser that automates web and desktop-based tasks. Providing deep search, cross-app workflow automation, images, coding and even music-all with military-grade security.
fellou.ai
October 20, 2025 at 8:53 AM
Claude Haiku 4.5を使ってみた。

電卓を、"Create a calculation app."という指示のみで作らせた。

* スピードは速い
* デザインに大きな破綻がない(最上位モデルでなく、破綻がないのは珍しいのでは)
* 四則演算などで、大きなバグはなさそう
* 演算記号を押した後も、もとの入力が保持されていて、同じ数が入る場合などでは、入力しずらい(9*9とか)
* 0で割ったときに、Infinityと出るが、その後は数字を入力したら、新しい計算が始まる

全体としては、一部使いづらい部分があったりするものの、結構いいし、スピードも速いので、プログラミングは強め。
October 16, 2025 at 4:24 AM
LM Arenaにて、Claude Sonnet 4.5(thinking)がGemini 2.5 Proを上回り、ランキングで1位になっている。

数値上は、得点差が1点なので、逆転するかもしれないが、少なくとも、匹敵はしているのですごい。

そろそろGemini 3.0が出るという噂があるので、それがどうなるか。
October 3, 2025 at 10:39 PM
今更な感じですが、自作イラストをnano bananaでフィギュア化しました。

プロンプトはGoogleが公開しているものを使いました。

現在少し問題となっている、ある企業のロゴっぽいものが生成される問題が発生したので、手動で編集してあります(白塗りしたため、若干違和感があると思います)

※生成AIの画像であり、販売するものではありません。
September 22, 2025 at 9:32 AM
新たにNoteを書きました。

今回は、PerplexityのAIブラウザCometを使用してみての感想と、AIブラウザについてです。

記事内にも書いてありますが、Cometの招待リンクを先日、ここ(Bluesky)で投稿しています(もしかすると、もう4つ全て使用されているかもしれません)。

note.com/kajitaka1201...
Comet使ってみた|kajitaka
はじめに 今回は、Perplexityが開発したAIブラウザのCometを使ってみた感想をまとめたみたいと思う。 あくまでも個人の意見なので、参考程度にとどめておいて下さい。 Cometについて Cometは、Perplexityの作成したAIブラウザです。 以下は、Perplexity公式のComet紹介ページの文章です(英語で引用したのは、日本語ページの文章がひどいからです)。 Co...
note.com
September 6, 2025 at 11:45 AM
PerplexityのブラウザComet用の招待リンクです。
1つにつき1人しか使用できないので、使用できない可能性があります。その際は、すみません。

また、数日かかるかもしれませんが、使用した感想をNoteにまとめる予定です。

perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
September 5, 2025 at 9:03 AM
Google検索のAI Modeを使ってみた(現在は英語のタスクのみ)。

* イメージは、Google版のPerplexityみたいな感じ。
* スピードは、思ったよりも速く、待つ感じはしない。
* 普通の検索にもすぐ飛ぶことができ、そこはGoogleらしいといった感じ。
* 日付は、IPアドレスから取得した大体の位置情報をベースに答えているらしい。
* 試した時は、画像などのアップロードは、UI自体はあるが、問題が発生したと言って回答が生成されない(何か制限があるのかも)。

精度は、もう少し使ってみないとわからないが、今のところ、大きなハルシネーションはなさそう。
August 26, 2025 at 10:56 PM
似たことを、やってみた。
GPT-5で9.9-9.11を計算するように言った結果が画像の通り。
間違った、-0.21という結果を出してきた。

ちなみに、Gemini 2.5 Flashは、-0.02というまた別の間違いを、Gemini 2.5 Proも-0.21という結果を出した。

LMArenaでも少しやってみたが、-0.21という結果を出すモデルもそれなりに存在することが分かった。

9.9と9.11の大きさの比較はできても何故か計算ができないモデルたち...
August 8, 2025 at 11:34 AM
Noteを書きました。
いつも、こちらで投稿している電卓を作らせるやつを、ベンチマークみたいに明文化しました。

最新のGPT-5やClaude Opus 4.1の結果も載せていますので、是非ご覧下さい。

note.com/kajitaka1201...
AI電卓ベンチマーク(v1)|kajitaka
はじめに 前にも記事にしたことがある、AIに電卓を作らせることによって、AIのプログラミング能力を測るベンチマーク(的なもの)を明文化してまとめようと思う。 その後、自分が使えるモデルがどれくらいの得点になるのかを書こうと思う。 概要 上でも書いたように、このベンチマークはAIに機能を指定した上で電卓を作らせ、AIのプログラミング能力を測るものである。 基本は前のNote記事で、プロンプト...
note.com
August 7, 2025 at 11:47 PM
GPT-5が発表されて、LMArenaでトップになっているものの(画像1つ目)、Gemini 2.5 Proとの直接対戦では、勝った割合が0.33とGemini 2.5 Proに負けている(画像2枚目)。
August 7, 2025 at 9:06 PM
ネットでGPT-5などと噂されているHorizon Alpha(現在はアップデート版のHorizon Betaが公開されていてそちらが使用可能)を使ってみた。

* 9.11と9.9の大小比較は見事、失敗
* strawberryのrの個数の問題は成功
* 検索機能もあり、日本の首相は正解

スピードは速く推論モデルかも微妙で、性能もいまいちなので、GPT-5ではない気がする。
あったとしてもGPT-5 nano、もしくはOpenAIのオープンモデルとかでは(そもそもOpenAIのモデルかも不明だけど)。

Horizon BetaはOpen Routerで利用可能です。
Horizon Beta - API, Providers, Stats
This is a cloaked model provided to the community to gather feedback. This is an improved version of [Horizon Alpha](/openrouter/horizon-alpha) Note: It’s free to use during this testing period, and ...
openrouter.ai
August 3, 2025 at 10:12 AM
Noteを公開しました。
本日、Rakuten AI OPTIMISMに行き、そこで、楽天AIを使用したため、追加で使用してみて、使用感などをまとめました。

note.com/kajitaka1201...
楽天AI 使ってみた|kajitaka
はじめに 今回は、「Rakuten AI OPTIMISM」に行ってきた際、初めて使ってみたため、それを記事にしようと思う。 そもそも楽天AIとは 楽天AIとは、名前の通り、楽天が開発するAIであり、最近、ショッピングなど楽天グループに関連するエージェント機能を追加した。 現在は、ベータ版で公開されていて、楽天のサイトの「今すぐベータ版に参加する」ボタンから利用することができる。 ※注意...
note.com
July 31, 2025 at 11:14 AM
個人的なつぶやき

ChatGPT agentが出ているのを見たが、個人的には、AIが全てタスクを完了させるものではなく、自分が主でAIは手助けの役割でタスクをやるようなやつが欲しい。
それこそ、コーディングにおけるGithub CopilotやGemini Code Assistみたいな感じ。

最近はAI自体の性能は良いので、簡単なタスクなら全てやらせても問題は起きないが、難しくなると問題を起こし始めたり、意図していたこととは違うことを始めたりするので、そこら辺を制御出来る機能があればいいと思う(エージェントだけど途中で口出せたり、そもそも手助けツールだったりみたいな感じで)。
July 18, 2025 at 11:30 AM
Noteを公開しました。
自分のプログラミングにおいてのAIの使用法について書いてみました。
よろしければ、この投稿かNoteのどちらかで各々のAIの使い方についての意見を書いていただけれると、嬉しいです。

note.com/kajitaka1201...
自分のAI使用法(プログラミングにおいて)|kajitaka
はじめに 今回は、現段階で自分がプログラミングをするのに当たって、自分がどのようにAIを使用しているのかについて、書いてみたいと思う。 前提 いつも作っているもの 自分は、Next.jsを使用し、ウェブアプリを作成している。 言語としては、Typescriptを主軸に、ライブラリがNext.jsやtailwind cssなどを使用している。 firebaseなどの外部ツールなどを使用する...
note.com
June 22, 2025 at 9:31 AM
Gemini 2.5 Flash Liteに電卓作らせてみた。

プロンプトは前のNoteのものです。

得点は20点満点中18点だった。

* デザインが、若干ボタンの間などが分かりづらい。
* エラーが表示される方法が、今までにない方法で、また、個人的に気に入った(画像の通り)
* thinkingもないため、13.1sで完成した(めちゃくちゃ速い)。

全体としては、thinkingがなくても、それなりにプログラミングの能力があり、ちょっとしたことなら、直ぐに完成するので、役に立ちそう。
June 18, 2025 at 10:53 AM
Gemini 2.5 Flashの正式版に電卓作らせてみた。

プロンプトは前のNoteのやつです。

得点付けをすると、20点満点中17点。

* デザインは結構特殊だが、文字も見やすいし、何をホバーしているのかなどが分かりやすい。
* スピードは、Proよりは速いが、thinkingをオンにしているため、1分ほどかかる。

プレビューの時と同じく、それなりのプログラミング能力はありそう。
それなりに簡単なタスクで、Proほどの時間をかけたくないときには便利になりそう。
June 18, 2025 at 10:41 AM
Gemini 2.5 Proの正式版で電卓タスクをやってみた。

プロンプトは前のNoteと同じもの。

Noteと同じ評価(プラスの得点なし)をすると、20点満点中19点。

* デザインが見たことのないもので、最新っぽい感じではないが、背景色と文字とのコントラストがちゃんと合って、文字が見えやすくなっている
* スピードは、thinkingで相当考えていることもあり、結構かかる(スピード重視用ではないのはプレビューと同じく)。

インターネットの意見を見ても、前のバージョンと大きな変化はないそうで、少し変更を加えて、正式版にしたといった感じだと思われる。
June 18, 2025 at 10:23 AM
Gemini 2.5 Flash Liteのプレビューが出ていたので、使ってみた。

速度はtokens per secondが266.3だったりする時もあり、相当速い。(比較対象:Flash実測値170.5)
日本語は若干表現がおかしいところが存在する。

よって、flash liteは、精度はあまり気にしないが、速度が重要というタスクにおいて、使うのが良さそう。
June 18, 2025 at 10:12 AM
Noteを投稿しました。
プログラミングにおいてのAIの能力を比較しました。
よく、このアカウントでやっている電卓のタスクを難しくして、その出来を得点化してランキング付けしました。

note.com/kajitaka1201...
最新AI比較(プログラミング)|kajitaka
はじめに 最近、GoogleがGemini 2.5 Pro Preview 0506を出し、その後AnthropicがClaude Sonnet 4とOpus 4を発表し、更にその後Gemini 2.5 Pro Preview 0605が発表されるなど、LLMの公開が相次いでいる。 そこでこの記事では、公開されているLLMのプログラミング能力について、電卓アプリを作らせるタスクで比較しようと思...
note.com
June 11, 2025 at 10:11 AM
Gemini Diffusionに電卓アプリを作らせてみた。

いつもと同じタスク(プロンプトはいつもは日本語ですが、今回は英語で書きました)。

* デザインに大きな破綻はない(若干直せそうだが)
* 計算はちゃんとできる
* 0で割ると、エラーが出るが、エラーを表示する文字が多く、スタイルが壊れる
* 浮動小数点数への計算は表示上9桁に丸めているため、対策はされているが、"0.200000000"みたいな感じの結果となるので惜しい
* 速度は意味が分からないほど速い(2.26sで、速度は697tokens/s)

ちゃんとしたものが、数秒で出来るので、簡単なタスクにはめっちゃ役に立ちそう。
June 9, 2025 at 11:20 PM
Gemini 2.5 Pro Preview 0605が出ていたので使ってみた。

いつもの電卓。

* デザインは問題はない(もう少し使いやすくは出来るが、及第点)
* 0で割ると、アラートが出てくる
* 浮動小数点計算は対応していない(写真の通り)
* かかった時間はthinkingを含めて51.1sで、特別速くもないが遅くもない

全体としては、それなりのプログラミング能力を持っていることは分かる(それ以上は、このプロンプトでは分からない)。
プロンプトも適当で、最新のモデルでは、基本的に合格してしまうので、新しいのを考えないと(キーボードショートカットの機能追加をお願いしたりとか?)。
June 5, 2025 at 11:26 PM
Chatbot ArenaでClaude 4 Opusを使ってみた。

いつもの電卓アプリ

* デザインは大きな問題はないが、若干使いづらい
* 0で割るとInfinityとなるが、その後数字を打ったら、新しい計算ができるようになる
* 浮動小数点数への対策はなし
* 速度は爆速(非推論モデル)

全体的には、非推論系モデルでは、トップレベルのコーディング能力を持っていることは、1回だけでも分かった。
ただ、SonnetやGemini 2.5 Proとの性能の違いは微妙(もっとやれば分かるかもだし、SonnetではClaudeのArtifactsを使っていたため、それも影響しているかも)。
May 29, 2025 at 11:38 AM
Noteを公開しました。

プログラミング学習の必要性についてです。
プログラミング教育をどうしたら良いか、共通テストの「情報」のプログラミングについても触れています。

note.com/kajitaka1201...
プログラミング学習は必要か?|kajitaka
はじめに 現在、生成AIの普及が進み、使ったことがある人は多いだろう。 その生成AIにおいて、最近、上位のプログラマーに匹敵するような性能をもつモデルも出てきている。 この様な時代に、プログラミングを学習することは意味があるのかについて考えてみたいと思う。 結論 まず、結論を言うと、プログラミング学習には明確な利点があると考える。 但し、その目的は、学習したプログラミングの技術でサイトや...
note.com
May 25, 2025 at 10:42 AM