Lightnews — Scholar-powered news

こんこん

@konkonmura.bsky.social

「異世界転生おじさん」が面白いので、英語話者にも勧めたいと思い第１話の公式動画を英字幕付きで観てみた。

音声認識自動翻訳の罠にむざむざと引っかかり、とんでもないことになっていて爆笑した。

元の台詞は「希望に満ちた表情で校門をくぐる」

January 27, 2025 at 11:30 PM

fusta

@furtivestar.bsky.social

「（約30年前に制度化された気象予報士が）短い時間で端的に大事な情報を伝えるために語尾を強く上げていったのではないか」・・・という冒頭の仮説から面食らう

「語尾下げ」の例の原稿読みが、確かに一昔前の？天気予報の自動音声ってこんな感じだったなと思った

最後の金田一さんの話はあまり納得できず・・

ともかく「語尾上げ」というものの認識から学び

November 4, 2024 at 1:23 PM

カーフ君

@catzjah.bsky.social

音声認識によって、自動翻訳や自動字幕に「順応する」というやり込み要素が浮き彫りとなった。
しかしこれは、絶対的には正なのに相対的には負である『無駄内政』フェチとして見るに対偶、真反対の「有効軍事」にあたるだろう。

個性のアーキテクチャがダンパー数に抗うとき、語彙や文法の歪み、弱点というスパイスが神髄となる。さもなくば単一指標としてのポピュリズムはトートロジーに収斂し、私にはビッグクランチの支持に見える。それはゆっくりしてない！
翻って、ジェンダーとしてのフリンジは異化を自己目的とするアレルゲンに過ぎないとの批判も成立するため、所詮は形而上のコップの掌上バエであろうか。シュレディンガーの飢え。

July 26, 2024 at 4:06 AM

サードニュース@相互フォロー100%

@new3rd.bsky.social

オンプレ閉域での生成AI自動要約、ベクストが新サービスを発表#東京都 #目黒区 #ベクスト #自動要約 #VextResume

ベクスト株式会社が、オンプレ環境向けの高精度な生成AI自動要約ソリューション「VextResume+」を発表。セキュリティ重視の設計で、音声認識テキストを効果的に要約します。

オンプレ閉域での生成AI自動要約、ベクストが新サービスを発表

ベクスト株式会社が、オンプレ環境向けの高精度な生成AI自動要約ソリューション「VextResume+」を発表。セキュリティ重視の設計で、音声認識テキストを効果的に要約します。

news.3rd-in.co.jp

February 25, 2025 at 11:36 PM

神沼三平太

@3peta.bsky.social

方針がだいぶ固まってきた。
まず雛形をコピーしてファイル名を変更。ファイル名をコピーしてシーケンス名を変更。マイクで音声を上書き。オーディオゲインでピークを-2に設定。本当はここでEQとかも入れるのだが、現状放置中（今後頑張る）。録音からテキストが自動認識されるので、フィラーワードと間を全削除。字幕をスタイル指定して書き出し。間が不自然なところを一つずつ修正。あとは表紙画像を入れ替えて長さを調整し。タイトルを入れて書き出し。
これで5分以内ならたぶん30分から1時間で公開までいける。

April 18, 2024 at 12:38 AM

taylors198900.bsky.social

@taylors198900.bsky.social

🎧 発音矯正機能
-AI音声認識による正確な発音評価システム
-日本語アクセントの癖を分析し個別指導
-ネイティブ発音との比較で効果的な改善

📊 個人適応型学習
-学習進度を自動分析し最適な難易度調整
-苦手分野の集中強化プログラム
-TOEIC、英検対策モードで試験対策も万全

⚡ 競合他社との差別化ポイント
-処理速度40%高速化（従来ソフト比較）
-月額980円の業界最安値価格設定
-24時間日本語カスタマーサポート完備
-オフライン学習機能で通勤時間も有効活用

🔗 trancy.org?via=TS1989
#TOEIC #英語学習 #通勤時間 #日本語 #発音

August 12, 2025 at 3:51 AM

browneyes :fedibird_02: aka ちゃいろ

@browneyes.fedibird.com.ap.brid.gy

興味深かったのが、ラップトップでのググるDocs経由の文字起こしは１割も拾ってくれず。

言葉としてはサラサラ流暢で、発音は一部を除いてだいぶ米語に寄せてる喋りではあったけど、まあネイティブじゃないからな、と、英語種を米国以外にあれこれ切り替えても拾えず。

それじゃあ、と、他のAndroid機よりは高性能な音声認識エンジン積んでる Pixel の音声入力試したら５割くらいは拾えるんだけど、途中で言語認識が英語からニポン語に自動で切り替わってた。

だいぶ流暢寄りでもAI的にはニポン語英語…ですらなく非英語と認識されてしまうものなんだなあ、へえ、となった。（むしろヒトとの会話では十二分 […]

Original post on fedibird.com

fedibird.com

October 31, 2025 at 9:06 AM

サードニュース@相互フォロー100%

@new3rd.bsky.social

大阪・関西万博で体験！自動ドア開錠システム「key voice」#大阪府 #AmiVoice #寝屋川市 #大阪弁 #WEST_inx

大阪・関西万博のWEST inxブースでは、AI音声認識技術を活用した自動ドア開錠システムが体験できる。来場者は大阪弁の発音に挑戦し扉を開く。子供から大人まで楽しめるこの展示に注目！

大阪・関西万博で体験！自動ドア開錠システム「key voice」

大阪・関西万博のWEST inxブースでは、AI音声認識技術を活用した自動ドア開錠システムが体験できる。来場者は大阪弁の発音に挑戦し扉を開く。子供から大人まで楽しめるこの展示に注目！

news.3rd-in.co.jp

April 23, 2025 at 4:25 AM

のん

@nj3448.bsky.social

ChatGPTに教えてもらったNotebookLMチップス。

① YouTubeのURLにliveが入っていると挿入ボタンが有効にならない。そのときはURLを修正する。
youtube.com/live/[A]
　↓
youtube.com/watch?v=[A]
（?si=以下は不要）

② それでもダメな場合は自動字幕がオンになっていないので、何らかのアプリで音声を録音してそのファイルをソースに追加する。（認識精度はかなり高い）

July 30, 2025 at 12:56 AM

デイリーHuggingFaceトレンド

@huggingfacetrends.bsky.social

今日のHuggingFaceトレンド

nvidia/canary-qwen-2.5b
このリポジトリは、自動音声認識（ASR）モデルの性能評価結果公開を目的に作成されました。
NemoライブラリのASRモデルについて、AMIやLibriSpeechなどの英語データセットにおけるWord Error Rate（WER）値とベンチマーク情報を提供します。

nvidia/canary-qwen-2.5b · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

July 22, 2025 at 10:20 AM

デイリーHuggingFaceトレンド

@huggingfacetrends.bsky.social

今日のHuggingFaceトレンド

nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリを用いて開発された英語の自動音声認識モデルの性能を公開するために作成されています。
複数の標準的なデータセットに対する単語誤り率が、評価結果として示されています。

nvidia/parakeet-tdt-0.6b-v2 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

May 16, 2025 at 10:18 AM

taylors198900.bsky.social

@taylors198900.bsky.social

1️⃣パーソナライズされた語彙力強化：動画内で知らない単語があった場合、AIが自動で単語帳を作成してくれます。さらに、復習が必要な単語を優先的に表示してくれるので、効率的に語彙力を強化できます
2️⃣発音矯正とシャドーイング： Trancyは音声認識技術を活用し、あなたの発音を正確に分析。お手本となるネイティブの発音と聞き比べながら、効果的なシャドーイング練習が可能です

🔗 trancy.org?via=TS1989
#英語学習
#モチベーション
#字幕
#AIツール
#発音矯

September 12, 2025 at 2:27 AM

にゅーす!

@news0.bsky.social

られています。 🤔 小泉進次郎氏が自民党総裁選での陣営による称賛コメント要請問題を謝罪し、再発防止を表明しました。 🙏
また、最新の脳科学ニュースでは、AIを活用した「次世代会議室」が開設されたことが報告されています。 🤖 この会議室では、AIが音声認識で雑談から課題を抽出し、まとめ資料を自動作成することができます。 📝
🌸 雰囲気や感情 🌸
ハッシュタグ #ニュース #最新情報 #トピックス
#エンターテイメント #宝塚歌劇 #脳科学 #AI

September 26, 2025 at 7:40 AM

ぶちくま

@buchikuma.bsky.social

記事の要約: スマート洗濯機市場は、2033年までに664億米ドルに達し、年平均成長率（CAGR）は20.5％と予測されています。この成長は、IoT統合、コネクテッドホームの普及、持続可能な家電トレンドに起因しています。特に、AIや音声認識技術の導入により、洗濯機は洗濯サイクルを自動調整し、省エネや効率性を向上させています。消費者は利便性や時間効率を重視し、特に若年層が多機能なスマート家電の需要を牽引しています。

市場はフロントロードとトップロードの製品、容量別（6kg未満、6～10kg、10kg以上）、用途別（住宅用、商業用）にセグメント化されており、持続的な成長が見込まれています。主要…

ぶちくま @buchikuma.bsky.social · 24d

「洗濯機市場洗濯機市場」に関する記事です: https://newscast.jp/smart/news/5165425

スマート洗濯機市場は、IoT統合、コネクテッドホームの普及、持続可能な家電トレンドを背景に、2033年までに664億米ドルに達すると予測され、年平均成長率（CAGR）は20.5％となる見込みである

ニュースをメディアだけではなくSNSで拡散。ニュース、ニュースリリース、プレスリリース発信サービス

newscast.jp

October 18, 2025 at 10:38 AM

どんちゃん

@dontonten06.bsky.social

FIREが落ちたので、ＰＣでユーチューブを見てるけど、
エアーウルフは無理だけど、ナイトライダーは現時点で実現可能じゃないかど思ったりするなぁヽ(^o^)丿
自動運転、音声認識、会話可能なＡＩ・・・
ジャンプ機能は難しそうだけどヽ(^o^)丿

April 26, 2024 at 5:25 PM

神原　圭司

@barayan-cage.bsky.social

相変わらず「総務省です。この電話は2時間後に使えなくなります」が掛かってくる。
完全無視してるんじゃが、即切りした方が掛かって来ないんかねえ？
自動応答だから放置してるんじゃが、全部聞いてから切れるんで、聞いてると認識されてんのか？ウザっ

ーあ、これ完全詐欺電話ですから相手しちゃ駄目ッスよ。
2時間経っても使えますし、
総務省ならもっと前に通達しろやって事ですし、電子音声とか失礼極まる話だし、そもそも書面で通達しろやって話ですし。

あと自動応答は「迷惑電話対策モードです」みたいな事を電話が勝手に言うんじゃよ。
知らない電話番号だと自動的になる。

November 21, 2024 at 12:43 AM

ピジェ

@xipj.bsky.social

そういえば、上海のホテルでフロントに行ったら自動翻訳アプリをひらいたスマホを渡されて、しゃべりたいこと咄嗟に出てこず（え、待って、これって英語の音声認識？おれが英語しゃべって認識される？いや、早く何か言わないと） "uh..." ってなったの、自分のことながらなんか笑えた（情弱？）

March 11, 2025 at 4:06 PM

サードニュース@相互フォロー100%

@new3rd.bsky.social

mocomoco、音声認識AIに校正機能を追加し品質向上を実現！#東京都 #港区 #音声認識 #mocomoco #mocoVoice_API

mocomocoが開発した音声認識AI『mocoVoice API』に新しい校正・校閲機能が加わりました。この機能により、音声をテキスト化するだけでなく、正確かつ読みやすい文章への自動整形が実現。

mocomoco、音声認識AIに校正機能を追加し品質向上を実現！

mocomocoが開発した音声認識AI『mocoVoice API』に新しい校正・校閲機能が加わりました。この機能により、音声をテキスト化するだけでなく、正確かつ読みやすい文章への自動整形が実現。

news.3rd-in.co.jp

April 11, 2025 at 6:28 AM

デイリーHuggingFaceトレンド

@huggingfacetrends.bsky.social

今日のHuggingFaceトレンド

nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリによる自動音声認識モデルを扱います。
様々な英語データセットでの音声認識精度（WER）が記載されています。

nvidia/parakeet-tdt-0.6b-v2 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

May 8, 2025 at 10:18 AM

SAKAKIBARA Yoji

@sakak.bsky.social

NVIDIAの自動音声認識モデルParakeetをサポートし、最新のMacで最大300倍高速に英語の文字起こしが可能になったAI文字起こしアプリ「MacWhisper v12.12」がリリース。 | AAPL Ch. applech2.com/archives/202...

NVIDIAの自動音声認識モデルParakeetをサポートし、最新のMacで最大300倍高速に英語の文字起こしが可能になったAI文字起こしアプリ「MacWhisper v12.12」がリリース。

Good Snoozeは現地時間2025年06月26日、新たに音声認識モデルParakeet(パラキート)をサポートした「MacWhisper v12.2」をリリースしたと発表しています。

applech2.com

July 1, 2025 at 12:39 AM

gigowat Ver.3.0

@gigowat.bsky.social

GIGAZINE より

元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表
ElevenLabs, a former Google engineer, unveils the world's most accurate voice recognition model, Scribe

元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表 - GIGAZINE ElevenLabs, a former Google engineer, unveils the world's most accurate automatic voice recognition model - GIGAZINE

元Googleの機械学習エンジニアであるピオトル・ドンブコウスキー氏らによって設立され、1億8000万ドル(約270億円)の資金調達を終えたばかりのAIスタートアップのElevenLabsが、世界で最も正確な自動音声認識(ASR)モデルの「Scribe」を発表しました。

gigazine.net

February 27, 2025 at 2:16 AM

サードニュース@相互フォロー100%

@new3rd.bsky.social

完全オフライン環境で議事録作成を実現した新ソフト登場#東京都 #港区 #楽々ぎじろー君Pro #オフライン議事録 #Tokyo_Properties

Tokyo Propertiesから新たに登場した『楽々ぎじろー君Pro＋AI要約』が、完全オフライン環境で効率的な議事録作成を実現。音声認識機能とAIによる自動要約で業務が楽に。