#文字起こし
うまいこと身の丈レベルの実用、自然言語検索とか文字起こしとか雑談相手とか、そのへんの成果物は残るだろうから、つまみぐいさせてもらおう
November 11, 2025 at 2:44 PM
真夜中のホラー!ただカップ麺を持って立ってる男なのでどうか安心してほしい…文字面だけでかなり怪しいけど!
ぐっすり寝てるところを起こすのはやっぱり申し訳ないですね😔そんな時はドア開け放っといて美味しそうな匂いで三葉ちゃんが起きるか作戦を決行します✊
グヌ…ってなりつつも一口食べちゃってて天星もにこっとしてますしどんどん食べてて欲しい!罪な味だからしょうがない!
塩味の新商品買ってきてくれるんだ…!優しさを感じます😌「夜中じゃないけど一緒に食べてみよう」ってウキウキで言ってますね✨
一方天星はたまに変な味を買って帰りますのでこれ食べられるんですか?と言われつつ三葉ちゃんを道連れにしたいです👍
November 11, 2025 at 2:34 PM
運動と食生活と風呂でデオウの効果を最大化して当日の朝風呂デオコで己の身体にJKを降ろす

文字に起こすとだいぶ......その、だいぶだね......!

まあ、オタクがアウターを脱いだ瞬間にJKの幻覚が振り撒かれたらオモロいのでやりますが
November 11, 2025 at 2:17 PM
同人誌の時の書き方は
(さっきのツリー式で)セリフを考えて文字起こししていく(オチが何パターンか出来る)→漫画にした時ページやコマが別れそうなところに区切り線を入れていく→それを元に一気に全ページラフ&コマ割りを描く→ペン入れとかして完成~!って感じ!
漫画は脳内イメージをそのまま出力しているだけなのでコマ割りで悩んだことはあんまりないかも…見開きで読みにくくないかとかは考えて後から調整するけど…
November 11, 2025 at 2:02 PM
「ヘンシン」で反応するSiriがこちら(「変身」のつもりで言ったけど漢字は「返信」)

2枚目は正しい反応
November 11, 2025 at 1:22 PM
なるほど…その発想はなかった😲

特に文字情報が元データに入っていると生成時にぐちゃぐちゃ文字崩壊起こしてる事多いのもワードサラダっぽさ感じるわね
絵も一種の言語で、AI生成のイラストに違和感を感じるのはワードサラダ的な要素があるからという一種の言い換えができる?
November 11, 2025 at 11:50 AM
わーーーー!ありがとうございます!

俺が脳内映像で文字アウトプットが一番早いタイプなので、「ネーム書いてる間に逃げちゃいそうだな……漫画でもいちいちテキストオンリーで起こす人おるんかな……」と思ってたので澪さんのやり方聞いてなんか「やってる!」という謎の安心感を得ています😭😭

(漫画媒体はコマ割りながらセリフ書いてるという謎の固定観念がありました🤤)
めっちゃタメになりますッッッッッ😭😭
November 11, 2025 at 11:43 AM
本件に関して、予算委での民民の田中けんとの実際の質疑を文字起こしした画像があった。あったんだけど、読んでも意味がわからなかった。各紙で記事を書いてる人もわからなかったのかもしれない。
November 11, 2025 at 11:34 AM
NCISで軍の人間を取り調べするときに認識番号しか言わへん場面があるけど、あれみたい。都合の悪いことにはカルト話法で乗り切ろうとする。記者さんらは会見の動画と文字起こしした文章が拡散することを見込んで、質問にいろんな事実を盛り込む作戦に出てはる気がする。
November 11, 2025 at 11:11 AM
AffinityのMac版やっと少し試してみた。あくまでも自分個人での使い方(←ここ重要)的には
・新規で写真なりイラストなりのデータを起こすのには必要十分そうで助かるなあ
・既存データ、とくに文字組んでるイラレデータに関しては文字が化けて使い物にならないな…Adobe Fontsもそこそこ使ってるし…
というかんじ(•ө•)
November 11, 2025 at 8:48 AM
最近動画編集の時、文字起こしにGeminiを活用しているのですが(動画から音声だけ切り取ったファイルを文字起こししてもらってる)
会長の生前のビデオ編集で凄く活躍してます。

会長って凄く方言(愛媛弁)がキツいので通常のAI文字起こしでは太刀打ちできなかったのですが、Geminiはできた。すごい。

そんなGeminiに助けられた、弊社社員サチコのnoteです
note.com/tabio_offici...
サチコ50代の挑戦!写ルンです時代に怯えた私を、Geminiが救う。|tabio pen
📝前回の記事はこちら 情けない話ですが、私は昔から写真というものが苦手だった。 嫌い、というよりは、むしろ怖い。 あれは一種の「呪い」だったではないかと思う。 昔のカメラ。写ルンですとか、あのシャッターを押すだけの一昔前のコンパクトカメラとか。 あれで旅先の、今日という日を、大事な人の顔を撮るでしょう。 フィルムをそっとカメラ屋さんに出して、数日後、「焼き増しですか?どうしますか?」なんて聞...
note.com
November 11, 2025 at 8:15 AM
280 blockerの迷惑電話対策まで込みのプラン課金してるけど、今、そういう電話が来た「迷惑電話の可能性あり」とデカデカとでた。まあ、留守番電話サービスに転送してそちらで録音されたら文字起こしが来るようにもしてるけど役に立った事はあまりない。迷惑電話の人もしくは機械ってそういう転送はすぐ切ってくれるからw
November 11, 2025 at 8:04 AM
私「失踪は事件、記憶喪失は活動休止、間違っても人は死なないし血は流れない。未来はいくつまでアイドルやんの?日常の切り取りにはネタに限度がある」
友「日常の転なんか躓き以上の何でもないよな」

こんな二人が世間と解釈違いを起こしながら文字書きやってるの、あまりにも生きづらい
November 11, 2025 at 7:33 AM
資源の海外流出 、EUの規制強化 、中国の輸出制限 —。
「経済安全保障の切り札」として「サーキュラーエコノミー(循環型経済)」を提唱
国内に眠る資源を活かすための未来への投資を解説

【第666回】日本は資源大国!?経済安全保障決定版!(2025/11/05) #山田太郎のさんちゃんねる 【文字起こし】
note.com/nijimorikoko...

#サーキュラーエコノミー #経済安全保障 #都市鉱山
【第666回】日本は資源大国!?経済安全保障決定版!(2025/11/05) #山田太郎のさんちゃんねる 【文字起こし】|虹杜ココロ
※この記事は配信を基に、AIツールを用いて内容を整理したものです。 今回のテーマとお知らせ 「山田太郎のさんちゃんねる」です。 今回は「日本は資源大国・経済安全保障決定版」という大きなテーマでお送りし、その中でも特に「サーキュラーエコノミー(循環型経済)」に関する重要な話をしていきたいと思っています。 今年のコミックマーケット(冬コミ)が開催される大晦日、12月31日の17時から「東京フォ...
note.com
November 11, 2025 at 6:10 AM
文字に起こすとだいぶao3なのに音声で聴くときゃんきゃん言い合ってるように聞こえるのおもしろい
November 11, 2025 at 6:08 AM
うちも使ってます最近。海外言語のミーティングを文字起こしして、翻訳と要約はチャッピーにしてます。(テンプレート活用でこの辺は単純に出来るのかも)
翻訳と要約はそこまで厳密性は求めてなくて、Obsidianに貼り付けて後で検索できればいいかなぐらいの感じ。
November 11, 2025 at 4:12 AM
GIGAZINE より

Metaが1600以上の言語に対応した文字起こしAI「Omnilingual ASR」を公開
Meta publishes AI "Omnilingual ASR" with characters for over 1600 languages
Metaが1600以上の言語に対応した文字起こしAI「Omnilingual ASR」を公開 - GIGAZINE Meta publishes AI "Omnilingual ASR" with characters for more than 1600 languages - GIGAZINE
Metaが文字起こしAI「Omnilingual ASR」をリリースしました。Omnilingual ASRは日本語を含む1600以上の言語の文字起こしに対応しており、対応言語を簡単に追加できることも特徴としています。
gigazine.net
November 11, 2025 at 3:06 AM
Claudeに手書きメモを文字起こしさせたが、英語に比べて日本語はやっぱまだまだやな。逆に英語は結構汚くても判別できる。
November 11, 2025 at 3:01 AM
ニュースだよ~

>Metaが1600以上の言語に対応した文字起こしAI「Omnilingual ASR」を公開
- https://gigazine.net/news/20251111-meta-omnilingual-asr/
November 11, 2025 at 2:11 AM
UI/UX的なところは、以下で紹介されてるLimitless Pendantのほうが優れている感じ。
note.com/tkgshn/n/nb7...

ADHD勢としては、こういう常時録音型のデバイスがウェアラブルグラスに統合されて、何もしなくても仕事中に会った人と話したことがクラウドに蓄積されて文字起こしされて要約されて後からキーワード検索できて次その人と会ったときに前回MTGの要約とアクションリストが表示されてるという状態をはやく実現したいものです(欲張りすぎ)

個人的にはグラス側に録画機能はいらない。あってもライフログ用途として5分に1回のスナップショット撮影程度でいいな。
3ヶ月使ったAIペンダントの比較レビュー:8万円使って結局Plaud AI Note PinからLimitless Pendantに乗り換えた|高木俊輔 Shunsuke Takagi
追記 2025/10/08 Limitlessペンダントの記事がバズり、紹介リンク経由で世界一Limitlessを売った男になりました。 また、実際の運用のコツなども書いた記事を公開しました この記事では、Plaud AI note pinというAIボイスレコーダーと、Limitless pendantという2つの似たようなガジェットを比較します。筆者は、どちらも購入して最上位のサ...
note.com
November 11, 2025 at 2:09 AM
不満点は、本体にwifi機能があるにも関わらず、録音完了したデータをwebに自動送信→文字起こししてくれないことかなあ。

Plaud noteの母艦はあくまでスマホ側のPlaudアプリで、これを起動して、ハードウェアとbluetoothまたはwifiのアドホックモードで接続してデータを転送しなければならない(アドホックモードへの遷移・復帰はアプリ内で行い、終了後は自動的に元のwifiに復帰するのでそれほど手間ではない。逆にbluetoothだと結構転送時間がかかるので使用必須な感じ)。
November 11, 2025 at 2:03 AM
コレどうなんかな〜と思いつつplaud note買ってみたところ、なかなか良かった。

①独自の言葉を登録して音声認識の精度を上げられる
②文字起こしを独自形式で要約するテンプレートを選択・作成できる
③同一音源の文字起こしに複数の要約テンプレートを適用できる

PKM(自分の場合はlogseq)に投入する前提で「出力の冒頭に[[aaa]]方式でキーワードリンクを入れて、本文は見出しのないシンプルなmarkdownに要約して、最後にアクションリストもつける」的テンプレートも簡単に作れた。

安定運用できるようになったら、Whisper Transcriptionは解約してもいいかも。
November 11, 2025 at 1:55 AM
ウィルマゼア急行〜3日目〜
同卓OK/げんみ×

現時点での自分の所感もとい妄想をメモしてるだけ
文字起こししてると考えをまとめやすいのは自分だけ?
fse.tw/TgsMts51
公開範囲:だれでも | subaru_xaさんの投稿 | fusetter(ふせったー)
伏せ字をつかってネタバレ回避!あふれる想いでつながるfusetter(ふせったー)
fse.tw
November 11, 2025 at 12:40 AM
RSSリーダーにニュース系のYouTubeチャンネル登録するの案外いいかも。
ちゃんと概要欄に文字起こしをしてくれている。(ニュースまとめ動画以外)
November 11, 2025 at 12:22 AM