Lightnews — Scholar-powered news

Kajitaka

@kajitaka.bsky.social

Gemini 3.0 ProにTodoアプリ作らせてみた。

電卓アプリに続き、「Todoアプリを作って。」という指示で、Canvasを使わせて、Todoアプリを作らせた。

* デザインは結構いい(分かりやすく、新しめUI)
* 追加や完了の機能も正常に動く
* 「完了済みを削除」を押すと完了にしたタスクが削除される機能付き

電卓アプリの時と同様、ウェブアプリのデザインは強め。速度も遅くない。

VibeCodingとか得意そう(GoogleがそういうIDEも作成していたくらいだし)。

a screenshot of a Todo App made by Gemini 3.0 Pro / Gemini 3.0が作成したTodoアプリ

November 18, 2025 at 11:17 PM

Kajitaka

@kajitaka.bsky.social

Gemini 3.0 Proに電卓を作らせた

ついに、Gmeini 3シリーズが出始めました

そのProモデルに、「電卓アプリを作って。」という指示で、Canvasを使わせて、電卓を作らせました(写真はスクリーンショット)

* デザインに大きな破綻なし
* 四則演算OK
* キーボードショートカット対応
* 浮動小数点数計算は問題が発生
* 0で割ったときには、Errorと出る

デザインなどに問題がないのは、ほぼまれで、速度も遅いという感じはしなかった。
1回目に、アイコン関連でエラーが発生していたが、自動でエラーを検知し、修正してくれた。

リーク通り、プログラミングの性能は高そう。

A screenshot of a calculator app made by Gemini 3.0 Pro / Gemini 3.0 Proが作った電卓アプリのスクリーンショット

November 18, 2025 at 11:11 PM

Kajitaka

@kajitaka.bsky.social

久しぶりに、Noteを更新しました。

AIを使用せずコーディングをしてみて、そこからプログラミングにおけるAIとの向き合い方について、個人的な感想をまとめてみたという内容です。

記事内にもある通り、「バイブコーディング編」(その名の通り、バイブコーディングを通して、この記事と同じことをするという内容)という記事を次に書こうと思っています。

note.com/kajitaka1201...

プログラミングにAIは必要か~AI不使用コーディング編~｜kajitaka

はじめに現在、Vibe Coding(AIを使用し、ノリでコーディングする)という言葉の成立する程、コーディングにおいて、AIはなくてはならない存在となっている。 AIは、コーディングのスピードを上げるなど、良い面もある一方、悪い面もあるはずである。そこで、今回は、「プログラミングにAIは必要か」というタイトル、「AI不使用コーディング編」というサブタイトルで、記事を書こうと思った。 ...

note.com

November 16, 2025 at 8:00 AM

Kajitaka

@kajitaka.bsky.social

FellouというAIブラウザを試してみた。

* UIは独自に設計されていて、Chromeなどのシンプルなブラウザを使っている人からすると、少し慣れないといけない(いいか悪いかはその人次第)
* AIのエージェント機能は、複数画面を同時に操作していたりと、面白いが、性能はいまいち(途中まで正しかったのに結論が間違えていたり)
* AI機能は途中から有料
* 新規タブを開くときにわざわざ検索欄が出てきて入力しないといけないなど、若干使いにくい部分が存在

ちょっと使った感じの感想ですが、全体としては、AI機能は面白いが、普段使いは自分はしない、といった感じです。

fellou.ai

Agentic AI Browser for Deep Search & Automation | Fellou

The world's first agentic AI browser that automates web and desktop-based tasks. Providing deep search, cross-app workflow automation, images, coding and even music-all with military-grade security.

fellou.ai

October 20, 2025 at 8:53 AM

Kajitaka

@kajitaka.bsky.social

Claude Haiku 4.5を使ってみた。

電卓を、"Create a calculation app."という指示のみで作らせた。

* スピードは速い
* デザインに大きな破綻がない(最上位モデルでなく、破綻がないのは珍しいのでは)
* 四則演算などで、大きなバグはなさそう
* 演算記号を押した後も、もとの入力が保持されていて、同じ数が入る場合などでは、入力しずらい(9*9とか)
* 0で割ったときに、Infinityと出るが、その後は数字を入力したら、新しい計算が始まる

全体としては、一部使いづらい部分があったりするものの、結構いいし、スピードも速いので、プログラミングは強め。

Calculation app by Claude Haiku 4.5 / Claude Haiku 4.5が作成した電卓アプリ

October 16, 2025 at 4:24 AM

Kajitaka

@kajitaka.bsky.social

LM Arenaにて、Claude Sonnet 4.5(thinking)がGemini 2.5 Proを上回り、ランキングで1位になっている。

数値上は、得点差が1点なので、逆転するかもしれないが、少なくとも、匹敵はしているのですごい。

そろそろGemini 3.0が出るという噂があるので、それがどうなるか。

October 3, 2025 at 10:39 PM

Kajitaka

@kajitaka.bsky.social

今更な感じですが、自作イラストをnano bananaでフィギュア化しました。

プロンプトはGoogleが公開しているものを使いました。

現在少し問題となっている、ある企業のロゴっぽいものが生成される問題が発生したので、手動で編集してあります(白塗りしたため、若干違和感があると思います)

※生成AIの画像であり、販売するものではありません。

September 22, 2025 at 9:32 AM

Kajitaka

@kajitaka.bsky.social

新たにNoteを書きました。

今回は、PerplexityのAIブラウザCometを使用してみての感想と、AIブラウザについてです。

記事内にも書いてありますが、Cometの招待リンクを先日、ここ(Bluesky)で投稿しています(もしかすると、もう4つ全て使用されているかもしれません)。

note.com/kajitaka1201...

Comet使ってみた｜kajitaka

はじめに今回は、Perplexityが開発したAIブラウザのCometを使ってみた感想をまとめたみたいと思う。あくまでも個人の意見なので、参考程度にとどめておいて下さい。 Cometについて Cometは、Perplexityの作成したAIブラウザです。以下は、Perplexity公式のComet紹介ページの文章です(英語で引用したのは、日本語ページの文章がひどいからです)。 Co...

note.com

September 6, 2025 at 11:45 AM

Kajitaka

@kajitaka.bsky.social

PerplexityのブラウザComet用の招待リンクです。
1つにつき1人しか使用できないので、使用できない可能性があります。その際は、すみません。

また、数日かかるかもしれませんが、使用した感想をNoteにまとめる予定です。

perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...

September 5, 2025 at 9:03 AM

Kajitaka

@kajitaka.bsky.social

Google検索のAI Modeを使ってみた(現在は英語のタスクのみ)。

* イメージは、Google版のPerplexityみたいな感じ。
* スピードは、思ったよりも速く、待つ感じはしない。
* 普通の検索にもすぐ飛ぶことができ、そこはGoogleらしいといった感じ。
* 日付は、IPアドレスから取得した大体の位置情報をベースに答えているらしい。
* 試した時は、画像などのアップロードは、UI自体はあるが、問題が発生したと言って回答が生成されない(何か制限があるのかも)。

精度は、もう少し使ってみないとわからないが、今のところ、大きなハルシネーションはなさそう。

August 26, 2025 at 10:56 PM

Kajitaka

@kajitaka.bsky.social

似たことを、やってみた。
GPT-5で9.9-9.11を計算するように言った結果が画像の通り。
間違った、-0.21という結果を出してきた。

ちなみに、Gemini 2.5 Flashは、-0.02というまた別の間違いを、Gemini 2.5 Proも-0.21という結果を出した。

LMArenaでも少しやってみたが、-0.21という結果を出すモデルもそれなりに存在することが分かった。

9.9と9.11の大きさの比較はできても何故か計算ができないモデルたち...

a screenshot of a chat with GPT-5, GPT-5 said that 9.9 - 9.11 = -0.21

August 8, 2025 at 11:34 AM

Kajitaka

@kajitaka.bsky.social

Noteを書きました。
いつも、こちらで投稿している電卓を作らせるやつを、ベンチマークみたいに明文化しました。

最新のGPT-5やClaude Opus 4.1の結果も載せていますので、是非ご覧下さい。

note.com/kajitaka1201...

AI電卓ベンチマーク(v1)｜kajitaka

はじめに前にも記事にしたことがある、AIに電卓を作らせることによって、AIのプログラミング能力を測るベンチマーク(的なもの)を明文化してまとめようと思う。その後、自分が使えるモデルがどれくらいの得点になるのかを書こうと思う。概要上でも書いたように、このベンチマークはAIに機能を指定した上で電卓を作らせ、AIのプログラミング能力を測るものである。基本は前のNote記事で、プロンプト...

note.com

August 7, 2025 at 11:47 PM

Kajitaka

@kajitaka.bsky.social

GPT-5が発表されて、LMArenaでトップになっているものの(画像1つ目)、Gemini 2.5 Proとの直接対戦では、勝った割合が0.33とGemini 2.5 Proに負けている(画像2枚目)。

a screenshot of leaderboard of LMArena. GPT-5 is at the top, followedby Gemini 2.5 Pro

a screen shot of win rate table in LMArena. GPT-5 is at the top, but loses to Gemini 2.5 Pro in head-to-head battles

August 7, 2025 at 9:06 PM

Kajitaka

@kajitaka.bsky.social

ネットでGPT-5などと噂されているHorizon Alpha(現在はアップデート版のHorizon Betaが公開されていてそちらが使用可能)を使ってみた。

* 9.11と9.9の大小比較は見事、失敗
* strawberryのrの個数の問題は成功
* 検索機能もあり、日本の首相は正解

スピードは速く推論モデルかも微妙で、性能もいまいちなので、GPT-5ではない気がする。
あったとしてもGPT-5 nano、もしくはOpenAIのオープンモデルとかでは(そもそもOpenAIのモデルかも不明だけど)。

Horizon BetaはOpen Routerで利用可能です。

Horizon Beta - API, Providers, Stats

This is a cloaked model provided to the community to gather feedback. This is an improved version of [Horizon Alpha](/openrouter/horizon-alpha) Note: It’s free to use during this testing period, and ...

openrouter.ai

August 3, 2025 at 10:12 AM

Kajitaka

@kajitaka.bsky.social

Noteを公開しました。
本日、Rakuten AI OPTIMISMに行き、そこで、楽天AIを使用したため、追加で使用してみて、使用感などをまとめました。

note.com/kajitaka1201...

楽天AI 使ってみた｜kajitaka

はじめに今回は、「Rakuten AI OPTIMISM」に行ってきた際、初めて使ってみたため、それを記事にしようと思う。そもそも楽天AIとは楽天AIとは、名前の通り、楽天が開発するAIであり、最近、ショッピングなど楽天グループに関連するエージェント機能を追加した。現在は、ベータ版で公開されていて、楽天のサイトの「今すぐベータ版に参加する」ボタンから利用することができる。 ※注意...

note.com

July 31, 2025 at 11:14 AM

Kajitaka

@kajitaka.bsky.social

個人的なつぶやき

ChatGPT agentが出ているのを見たが、個人的には、AIが全てタスクを完了させるものではなく、自分が主でAIは手助けの役割でタスクをやるようなやつが欲しい。
それこそ、コーディングにおけるGithub CopilotやGemini Code Assistみたいな感じ。

最近はAI自体の性能は良いので、簡単なタスクなら全てやらせても問題は起きないが、難しくなると問題を起こし始めたり、意図していたこととは違うことを始めたりするので、そこら辺を制御出来る機能があればいいと思う(エージェントだけど途中で口出せたり、そもそも手助けツールだったりみたいな感じで)。

July 18, 2025 at 11:30 AM

Kajitaka

@kajitaka.bsky.social

Noteを公開しました。
自分のプログラミングにおいてのAIの使用法について書いてみました。
よろしければ、この投稿かNoteのどちらかで各々のAIの使い方についての意見を書いていただけれると、嬉しいです。

note.com/kajitaka1201...

自分のAI使用法(プログラミングにおいて)｜kajitaka

はじめに今回は、現段階で自分がプログラミングをするのに当たって、自分がどのようにAIを使用しているのかについて、書いてみたいと思う。前提いつも作っているもの自分は、Next.jsを使用し、ウェブアプリを作成している。言語としては、Typescriptを主軸に、ライブラリがNext.jsやtailwind cssなどを使用している。 firebaseなどの外部ツールなどを使用する...

note.com

June 22, 2025 at 9:31 AM

Kajitaka

@kajitaka.bsky.social

Gemini 2.5 Flash Liteに電卓作らせてみた。

プロンプトは前のNoteのものです。

得点は20点満点中18点だった。

* デザインが、若干ボタンの間などが分かりづらい。
* エラーが表示される方法が、今までにない方法で、また、個人的に気に入った(画像の通り)
* thinkingもないため、13.1sで完成した(めちゃくちゃ速い)。

全体としては、thinkingがなくても、それなりにプログラミングの能力があり、ちょっとしたことなら、直ぐに完成するので、役に立ちそう。

Gemini 2.5 Flash Lite Preview 06-17が作成した電卓のスクリーンショット。0で割ったときのエラーが表示されている。 / a screenshot of a calculator made by Gemini 2.5 Flash Lite Preview 06-17. the error when divinding by 0 is displayed.

June 18, 2025 at 10:53 AM

Kajitaka

@kajitaka.bsky.social

Gemini 2.5 Flashの正式版に電卓作らせてみた。

プロンプトは前のNoteのやつです。

得点付けをすると、20点満点中17点。

* デザインは結構特殊だが、文字も見やすいし、何をホバーしているのかなどが分かりやすい。
* スピードは、Proよりは速いが、thinkingをオンにしているため、1分ほどかかる。

プレビューの時と同じく、それなりのプログラミング能力はありそう。
それなりに簡単なタスクで、Proほどの時間をかけたくないときには便利になりそう。

Gemini 2.5 Flashが作成した電卓アプリのスクリーンショット / a screenshot of a calculator made by Gemini 2.5 Flash

June 18, 2025 at 10:41 AM

Kajitaka

@kajitaka.bsky.social

Gemini 2.5 Proの正式版で電卓タスクをやってみた。

プロンプトは前のNoteと同じもの。

Noteと同じ評価(プラスの得点なし)をすると、20点満点中19点。

* デザインが見たことのないもので、最新っぽい感じではないが、背景色と文字とのコントラストがちゃんと合って、文字が見えやすくなっている
* スピードは、thinkingで相当考えていることもあり、結構かかる(スピード重視用ではないのはプレビューと同じく)。

インターネットの意見を見ても、前のバージョンと大きな変化はないそうで、少し変更を加えて、正式版にしたといった感じだと思われる。

Gemini 2.5 Proが作成した電卓のスクリーンショット / a screenshot of a calculator made by Gemini 2.5 Pro

June 18, 2025 at 10:23 AM

Kajitaka

@kajitaka.bsky.social

Gemini 2.5 Flash Liteのプレビューが出ていたので、使ってみた。

速度はtokens per secondが266.3だったりする時もあり、相当速い。(比較対象：Flash実測値170.5)
日本語は若干表現がおかしいところが存在する。

よって、flash liteは、精度はあまり気にしないが、速度が重要というタスクにおいて、使うのが良さそう。

June 18, 2025 at 10:12 AM

Kajitaka

@kajitaka.bsky.social

Note投稿しました。
前にこちらで投稿した、Gemini Diffusionについてです。

note.com/kajitaka1201...

Gemini Diffusion使ってみた｜kajitaka

はじめに Gemini Diffusionとは、Google Deepmindが開発した、テキスト生成の拡散モデルです(拡散モデルとは、ノイズからノイズの除去を行っていき、最終的なものを作成すると言うもので、現在は画像生成AIで主に使用されている技術です)。現在、Gemini Diffusionはウェイトリストに参加し、審査が通ることで、使用することが出来るようになります(よって、通常公開は...

note.com

June 15, 2025 at 10:25 AM

Kajitaka

@kajitaka.bsky.social

Noteを投稿しました。
プログラミングにおいてのAIの能力を比較しました。
よく、このアカウントでやっている電卓のタスクを難しくして、その出来を得点化してランキング付けしました。

note.com/kajitaka1201...

最新AI比較(プログラミング)｜kajitaka

はじめに最近、GoogleがGemini 2.5 Pro Preview 0506を出し、その後AnthropicがClaude Sonnet 4とOpus 4を発表し、更にその後Gemini 2.5 Pro Preview 0605が発表されるなど、LLMの公開が相次いでいる。そこでこの記事では、公開されているLLMのプログラミング能力について、電卓アプリを作らせるタスクで比較しようと思...

note.com

June 11, 2025 at 10:11 AM

Kajitaka

@kajitaka.bsky.social

Gemini Diffusionに電卓アプリを作らせてみた。

いつもと同じタスク(プロンプトはいつもは日本語ですが、今回は英語で書きました)。

* デザインに大きな破綻はない(若干直せそうだが)
* 計算はちゃんとできる
* 0で割ると、エラーが出るが、エラーを表示する文字が多く、スタイルが壊れる
* 浮動小数点数への計算は表示上9桁に丸めているため、対策はされているが、"0.200000000"みたいな感じの結果となるので惜しい
* 速度は意味が分からないほど速い(2.26sで、速度は697tokens/s)

ちゃんとしたものが、数秒で出来るので、簡単なタスクにはめっちゃ役に立ちそう。

a screenshot of a calculator made by Gemini Diffusion / Gemini Diffusionが作成した電卓アプリのスクリーンショット

June 9, 2025 at 11:20 PM

Kajitaka

@kajitaka.bsky.social

Gemini 2.5 Pro Preview 0605が出ていたので使ってみた。

いつもの電卓。

* デザインは問題はない(もう少し使いやすくは出来るが、及第点)
* 0で割ると、アラートが出てくる
* 浮動小数点計算は対応していない(写真の通り)
* かかった時間はthinkingを含めて51.1sで、特別速くもないが遅くもない

全体としては、それなりのプログラミング能力を持っていることは分かる(それ以上は、このプロンプトでは分からない)。
プロンプトも適当で、最新のモデルでは、基本的に合格してしまうので、新しいのを考えないと(キーボードショートカットの機能追加をお願いしたりとか?)。

a screenshot of a calculator made by Gemini 2.5 Pro Preview 0605 / Gemini 2.5 Pro Preview 0605が作った電卓のスクリーンショット

June 5, 2025 at 11:26 PM

Add to Home Screen

Light up
your news

Add to Home Screen

Light upyour news

Sign in to Lightnews

Sign up to start reading

Connect Bluesky

Connect with Bluesky

Light up
your news