羊インク
sheepink.bsky.social
羊インク
@sheepink.bsky.social
2 followers 4 following 52 posts
Posts Media Videos Starter Packs
ひょんなことからEmacsにハマりそうになっている。
WebにあるAI関連の情報の大半は、「すげえ!!」「革新的!!」などと扇情的ではあるが実務的な中味がなくて役に立たない。

この流行り病があるていど落ち着くのを待つしかないのだろうな。
AIブラウザのエージェント機能の使い道は、まだ今のところピンと来てない。

たいていの定型的な作業は、PowerAutomateとか使ったほうが「早い・確実・安全」であろうし。

Cloudflareのような複雑怪奇なWebアプリで、「○○の設定はするためのページを探して、そこに移動して」みたいな指示をするときは便利だけど、それ以外の使いどころを見つけられていない。
3ヶ月ばかし気づいていなかったが、AIブラウザCometはローカルのディレクトリやファィルにアクセスできる。

つまりブラウザでPDFはもちろんMarkdownやHTML等も開ける。Obsidianのノートも開ける。それらの内容をAIは自動で把握する。

WSL2の中のディレクトリやファイルも開けるのよ💦
つまりCometやAtlasのようなAIブラウザでも(Windowsデスクトップ限定ではあるが)、いろんな操作をマウス&ロッカージェスチャーでできるのよ。

Cometであれば、開いているページの要約を、マウスの特定の動きでやってもらう、とかね。
マウスジェスチャーやロッカージェスチャーは、Chrome系のブラウザだと「crxMouse拡張」を使うのが定番のようだけど、`StrokesPlus.net`の方が色々なことができるし、ブラウザ内部ページでも挙動するから便利だな。

マクロも組めるし、ShortcutKey2URLのような拡張と組み合わせれば、マウスの動きで任意のURLに移動する、といったこともできる。

もちろんVivaldiなら標準機能でマウスジェスチャーが使えるが、この`StrokesPlus.net`は、ブラウザ以外のアプリでもジェスチャーが使える(しかもアプリごとに個別設定もできる)のが強い。
Obsidianでマウスジェスチャー&ロッカージェスチャーを使えるようにしてみた。

ブラウザと比較すれば用途は限定的だけど、とはいえ便利。

このデスクトップアプリを使った→ www.strokesplus.net
ScrivenerのUIは超苦手!! Zettlrは悪くない。ショートカットがカスタマイズ可能で、かつCSSカスマイズがもっと柔軟にできれば採用したかも。

総合的にはObsidianが、執筆用マークダウンエディタとしても最も使い勝手がよさそうだが、既にノートアプリとして使用しているので、できれば執筆ツールは分離したい(Vaultを分けてみたが、いまいち)。

いっそVSCodeで開発だけでなく執筆も…という手もあるが、いやあ、最終盤の仕上げはともかく、ドラフト段階でVSCodeはちょっと違うかなあ、と。AIを絡ませたい訳でもないし。

ということで執筆空間はTyporaに傾きつつあり。
Vivaldiが、(AI連携を除いた旧来の)機能面で、もっとも優れたブラウザであるとの感想は変わらない。

でも、20日ぶりにインストールしてみて、「無理、もう思想が合わない」って感じて、すぐにアンインストール。

Comet, Edge, Brave, Chrome, Firefox, Floorpなど触ってみて、いちばん思想的な相性がしっくり来るのはZen browserだなと感じる。
アイデア出しにAIを使いたい気持ちは皆無だな。知りたいことに、なるべく正確に回答してもらったり、あるいは調査のヒントが得られれば十分。だからPerplexityが性に合うんだろう。
かれこれ1ヶ月くらいWorkflowyをブラウザにピン留めして、使ってみようとしてみた。

ほとんど使わなかった。

今までも自分は、Dinalistを試したみたり、Obsidianでアウトライン用のページを作ってみたり、いろいろ試してみたのだけれど、結局のところ、定着しない。

万年筆でノートに書くほうがいいや、ってなる。

WorkflowyのUIはかなり好きだし、新たに始まったTodayの機能も興味深いんだけどね。ここらで離脱する。
結局メインブラウザは、CometからZen Browserに戻してみた。AI連携ブラウザの機能的な便利さよりも、UIの心地よさを優先したくなった。けっこう触れている時間が長いからね~。
ちなみに、大量のキャプチャ画像をまとめて1つのPDFにするときは、「画像を全選択 > 印刷 > PDFアプリを選択」するのだが。

Windows標準のアプリよりも、PDF24というアプリをインストールして選択した方が、画質の面でも、タイトルの設定等が可能な点でも便利である。

なお参照記事では、キャプチャ画像から余白を一括除去するためにXnCovertの使用を推奨しているが、これは個人的には不要な手順だと思った。

Kindleアプリのページを試しにスクショして、印刷プレビューで確認して、またKindleに戻って、文字サイズや横幅などを調整したほうが楽だと思った。
もちろんPDFはGoogle Driveなどクラウドにアップしてもよい。その場合(おそらく)Cometは、PDF文書全体の文脈を自動で把握するだろう。

ただし、ローカルと異なり、OCR(画像の文章をテキスト化)の処理は、何らかのアプリ等で別に行う必要が出てくる。

私はその処理が面倒なので、「じゃあ、ローカルのPDFを直接Cometで開けばいいや」となってる。
Kindleのコンテンツは扱いづらい。デスクトップアプリの使い勝手は悪いし。

1ページずつスクショしてPDF化する。Power Automate で自動化できる。

PDF化してしまえば、AIブラウザCometで開ける。

元がキャプチャでも、Cometは自動で文章を認識できるから大丈夫。テキスト部分はコピペ可能で、サイドバーのAIチャットに貼り付けて質問できる。

Cometは、ローカルのファイルは「勝手に読みにいかない」仕様なので、開いているPDF全体のコンテキストを自動で把握はしてくれない。それでも十分に便利だが。

参考記事: scombu.com/2022/05/29/w...
Web上のドキュメントを(外国語だったらPlamoで翻訳してから)、AIブラウザCometで、質問を重ねながら読み解くことに慣れてしまうと、Kindle本というのは扱いづらくて不便だね。特にブラウザで開けないやつは。
AIブラウザCometに、VivaldiやOperaみたいな「スピードダイヤル」を付けてみた。Chrome拡張のSpeed Dial 2を使用。

ただしCometだと、このスピードダイヤルを「ホーム」や「起動時に開くページ」として設定することは不可。ピン留めタブにしたり、ブックマークバーに置くなどの工夫がいる。

Comet標準のAIアシスタントが常駐するサイドバーとは別に、任意のサイトを登録しておけるWebパネルも追加している。これは、Anything Copilot という拡張を使用している。

chromewebstore.google.com/detail/speed...
Notionはブラウザで開けるから、AIブラウザCometとの相性がとても良いのだが、動作が重たく微妙な使用感なのは相変わらずだね。Obsidianの軽快さには遠く及ばない。
質問の関連情報をNotion等でノートにまとめ、それをCometブラウザに表示した上で、AIアシスタント(Perplexity)に質問すると、いちばん回答の精度が高くなるなと感じている。

VSCodeの拡張(Codexとか)やCLIのAIは、いまいち使いこなし方が分かっていないせいか、ブラウザ版と比べて満足のいく回答が得られにくい。
あんまり話題にならないけど、個人的にはAIはPerplexityをいちばん愛用している。GTPは5になっても、回答の精度が一歩及ばないかな、と。

Grokも結構いい。GoogleのAIモードは、実質Geminiと同じはずなんだけど、なんかGeminiよりマシな気がするしサクサクと問答が進むのが良い。

CometブラウザでPerplexityをメインで使い、「ん?」と疑問に感じる回答がきたらGrokにも投げてみる。

あまり回答の精度を気にせずに、ざっくりした質問をたくさん投げて、だんだんにポイントを掴みたいときはGoogle AIモードを使ってみたりもする感じ。
おーAI一体型のブラウザComet一般公開したのか。Perplexityのプロユーザーだから7月から使ってみている。

VivaldiはもちろんのことEdgeと比べてもAI以外の機能は弱いが、AIエージェントの部分は現時点で一番良い。

www.perplexity.ai/comet?utm_so...
Comet Browser: a Personal AI Assistant
Comet browser by Perplexity is the AI browser that acts as a personal assistant. Automate tasks, research the web, organize your email, and more with Comet.
www.perplexity.ai
あと、翻訳はPLaMoの拡張が良い。生成される日本語が自然で、海外ドキュメントを確認するときに苦痛がだいぶ和らぐ、というか、かなり普通に読める。

plamo.preferredai.jp
PLaMo
PLaMoは、Preferred Networks (PFN)が独自に開発する国産の生成AI基盤モデルです。無料のChatやAPI経由ですぐにご利用可能です。
plamo.preferredai.jp
Cometはダググループはあるが、ワークスペースやスピードダイヤルといった機能はない。

ブックマークがごちゃつくのが嫌なので、使用頻度の低いブックマークについてはNotionにリンク集を作った。
Power Mouse X は、右マウスボタンを押しながらドラックすると「リング」および「ブックマーク一覧」が出るのが便利。やや設定画面にくせがあり、一部バグもあるが。

リンクや画像上で左押しドラックしたときにリングが表示される「ドラッグオプション」という機能やマウスジェスチャーもあるが、私はオフにしている。マウスジェスチャーは専用の拡張の方が個人的に使い勝手が良いので。

chromewebstore.google.com/detail/mnmmb...
CometのAIアシスタントとAnything Copilot 拡張のサイドバーの両方を表示させると、PerplexityとGrokに質問しながらWebドキュメントを読み解く、といった使い方も可能になる。

ただし、Cometと一体化しているPerplexityはブラウザで開いているWebページのコンテキストを自動で解釈できるが、他のAIは、ただサイドバーにいるだけではある。それでも便利だが。

chromewebstore.google.com/detail/anyth...