「異世界転生おじさん」が面白いので、英語話者にも勧めたいと思い第1話の公式動画を英字幕付きで観てみた。
音声認識自動翻訳の罠にむざむざと引っかかり、とんでもないことになっていて爆笑した。
元の台詞は「希望に満ちた表情で校門をくぐる」
音声認識自動翻訳の罠にむざむざと引っかかり、とんでもないことになっていて爆笑した。
元の台詞は「希望に満ちた表情で校門をくぐる」
January 27, 2025 at 11:30 PM
「異世界転生おじさん」が面白いので、英語話者にも勧めたいと思い第1話の公式動画を英字幕付きで観てみた。
音声認識自動翻訳の罠にむざむざと引っかかり、とんでもないことになっていて爆笑した。
元の台詞は「希望に満ちた表情で校門をくぐる」
音声認識自動翻訳の罠にむざむざと引っかかり、とんでもないことになっていて爆笑した。
元の台詞は「希望に満ちた表情で校門をくぐる」
「(約30年前に制度化された気象予報士が)短い時間で端的に大事な情報を伝えるために語尾を強く上げていったのではないか」・・・という冒頭の仮説から面食らう
「語尾下げ」の例の原稿読みが、確かに一昔前の?天気予報の自動音声ってこんな感じだったなと思った
最後の金田一さんの話はあまり納得できず・・
ともかく「語尾上げ」というものの認識から学び
「語尾下げ」の例の原稿読みが、確かに一昔前の?天気予報の自動音声ってこんな感じだったなと思った
最後の金田一さんの話はあまり納得できず・・
ともかく「語尾上げ」というものの認識から学び
November 4, 2024 at 1:23 PM
「(約30年前に制度化された気象予報士が)短い時間で端的に大事な情報を伝えるために語尾を強く上げていったのではないか」・・・という冒頭の仮説から面食らう
「語尾下げ」の例の原稿読みが、確かに一昔前の?天気予報の自動音声ってこんな感じだったなと思った
最後の金田一さんの話はあまり納得できず・・
ともかく「語尾上げ」というものの認識から学び
「語尾下げ」の例の原稿読みが、確かに一昔前の?天気予報の自動音声ってこんな感じだったなと思った
最後の金田一さんの話はあまり納得できず・・
ともかく「語尾上げ」というものの認識から学び
音声認識によって、自動翻訳や自動字幕に「順応する」というやり込み要素が浮き彫りとなった。
しかしこれは、絶対的には正なのに相対的には負である『無駄内政』フェチとして見るに対偶、真反対の「有効軍事」にあたるだろう。
個性のアーキテクチャがダンパー数に抗うとき、語彙や文法の歪み、弱点というスパイスが神髄となる。さもなくば単一指標としてのポピュリズムはトートロジーに収斂し、私にはビッグクランチの支持に見える。それはゆっくりしてない!
翻って、ジェンダーとしてのフリンジは異化を自己目的とするアレルゲンに過ぎないとの批判も成立するため、所詮は形而上のコップの掌上バエであろうか。シュレディンガーの飢え。
しかしこれは、絶対的には正なのに相対的には負である『無駄内政』フェチとして見るに対偶、真反対の「有効軍事」にあたるだろう。
個性のアーキテクチャがダンパー数に抗うとき、語彙や文法の歪み、弱点というスパイスが神髄となる。さもなくば単一指標としてのポピュリズムはトートロジーに収斂し、私にはビッグクランチの支持に見える。それはゆっくりしてない!
翻って、ジェンダーとしてのフリンジは異化を自己目的とするアレルゲンに過ぎないとの批判も成立するため、所詮は形而上のコップの掌上バエであろうか。シュレディンガーの飢え。
July 26, 2024 at 4:06 AM
音声認識によって、自動翻訳や自動字幕に「順応する」というやり込み要素が浮き彫りとなった。
しかしこれは、絶対的には正なのに相対的には負である『無駄内政』フェチとして見るに対偶、真反対の「有効軍事」にあたるだろう。
個性のアーキテクチャがダンパー数に抗うとき、語彙や文法の歪み、弱点というスパイスが神髄となる。さもなくば単一指標としてのポピュリズムはトートロジーに収斂し、私にはビッグクランチの支持に見える。それはゆっくりしてない!
翻って、ジェンダーとしてのフリンジは異化を自己目的とするアレルゲンに過ぎないとの批判も成立するため、所詮は形而上のコップの掌上バエであろうか。シュレディンガーの飢え。
しかしこれは、絶対的には正なのに相対的には負である『無駄内政』フェチとして見るに対偶、真反対の「有効軍事」にあたるだろう。
個性のアーキテクチャがダンパー数に抗うとき、語彙や文法の歪み、弱点というスパイスが神髄となる。さもなくば単一指標としてのポピュリズムはトートロジーに収斂し、私にはビッグクランチの支持に見える。それはゆっくりしてない!
翻って、ジェンダーとしてのフリンジは異化を自己目的とするアレルゲンに過ぎないとの批判も成立するため、所詮は形而上のコップの掌上バエであろうか。シュレディンガーの飢え。
オンプレ閉域での生成AI自動要約、ベクストが新サービスを発表#東京都#目黒区#ベクスト#自動要約#VextResume
ベクスト株式会社が、オンプレ環境向けの高精度な生成AI自動要約ソリューション「VextResume+」を発表。セキュリティ重視の設計で、音声認識テキストを効果的に要約します。
ベクスト株式会社が、オンプレ環境向けの高精度な生成AI自動要約ソリューション「VextResume+」を発表。セキュリティ重視の設計で、音声認識テキストを効果的に要約します。
オンプレ閉域での生成AI自動要約、ベクストが新サービスを発表
ベクスト株式会社が、オンプレ環境向けの高精度な生成AI自動要約ソリューション「VextResume+」を発表。セキュリティ重視の設計で、音声認識テキストを効果的に要約します。
news.3rd-in.co.jp
February 25, 2025 at 11:36 PM
オンプレ閉域での生成AI自動要約、ベクストが新サービスを発表#東京都#目黒区#ベクスト#自動要約#VextResume
ベクスト株式会社が、オンプレ環境向けの高精度な生成AI自動要約ソリューション「VextResume+」を発表。セキュリティ重視の設計で、音声認識テキストを効果的に要約します。
ベクスト株式会社が、オンプレ環境向けの高精度な生成AI自動要約ソリューション「VextResume+」を発表。セキュリティ重視の設計で、音声認識テキストを効果的に要約します。
方針がだいぶ固まってきた。
まず雛形をコピーしてファイル名を変更。ファイル名をコピーしてシーケンス名を変更。マイクで音声を上書き。オーディオゲインでピークを-2に設定。本当はここでEQとかも入れるのだが、現状放置中(今後頑張る)。録音からテキストが自動認識されるので、フィラーワードと間を全削除。字幕をスタイル指定して書き出し。間が不自然なところを一つずつ修正。あとは表紙画像を入れ替えて長さを調整し。タイトルを入れて書き出し。
これで5分以内ならたぶん30分から1時間で公開までいける。
まず雛形をコピーしてファイル名を変更。ファイル名をコピーしてシーケンス名を変更。マイクで音声を上書き。オーディオゲインでピークを-2に設定。本当はここでEQとかも入れるのだが、現状放置中(今後頑張る)。録音からテキストが自動認識されるので、フィラーワードと間を全削除。字幕をスタイル指定して書き出し。間が不自然なところを一つずつ修正。あとは表紙画像を入れ替えて長さを調整し。タイトルを入れて書き出し。
これで5分以内ならたぶん30分から1時間で公開までいける。
April 18, 2024 at 12:38 AM
方針がだいぶ固まってきた。
まず雛形をコピーしてファイル名を変更。ファイル名をコピーしてシーケンス名を変更。マイクで音声を上書き。オーディオゲインでピークを-2に設定。本当はここでEQとかも入れるのだが、現状放置中(今後頑張る)。録音からテキストが自動認識されるので、フィラーワードと間を全削除。字幕をスタイル指定して書き出し。間が不自然なところを一つずつ修正。あとは表紙画像を入れ替えて長さを調整し。タイトルを入れて書き出し。
これで5分以内ならたぶん30分から1時間で公開までいける。
まず雛形をコピーしてファイル名を変更。ファイル名をコピーしてシーケンス名を変更。マイクで音声を上書き。オーディオゲインでピークを-2に設定。本当はここでEQとかも入れるのだが、現状放置中(今後頑張る)。録音からテキストが自動認識されるので、フィラーワードと間を全削除。字幕をスタイル指定して書き出し。間が不自然なところを一つずつ修正。あとは表紙画像を入れ替えて長さを調整し。タイトルを入れて書き出し。
これで5分以内ならたぶん30分から1時間で公開までいける。
🎧 発音矯正機能
-AI音声認識による正確な発音評価システム
-日本語アクセントの癖を分析し個別指導
-ネイティブ発音との比較で効果的な改善
📊 個人適応型学習
-学習進度を自動分析し最適な難易度調整
-苦手分野の集中強化プログラム
-TOEIC、英検対策モードで試験対策も万全
⚡ 競合他社との差別化ポイント
-処理速度40%高速化(従来ソフト比較)
-月額980円の業界最安値価格設定
-24時間日本語カスタマーサポート完備
-オフライン学習機能で通勤時間も有効活用
🔗 trancy.org?via=TS1989
#TOEIC #英語学習 #通勤時間 #日本語 #発音
-AI音声認識による正確な発音評価システム
-日本語アクセントの癖を分析し個別指導
-ネイティブ発音との比較で効果的な改善
📊 個人適応型学習
-学習進度を自動分析し最適な難易度調整
-苦手分野の集中強化プログラム
-TOEIC、英検対策モードで試験対策も万全
⚡ 競合他社との差別化ポイント
-処理速度40%高速化(従来ソフト比較)
-月額980円の業界最安値価格設定
-24時間日本語カスタマーサポート完備
-オフライン学習機能で通勤時間も有効活用
🔗 trancy.org?via=TS1989
#TOEIC #英語学習 #通勤時間 #日本語 #発音
August 12, 2025 at 3:51 AM
興味深かったのが、ラップトップでのググるDocs経由の文字起こしは1割も拾ってくれず。
言葉としてはサラサラ流暢で、発音は一部を除いてだいぶ米語に寄せてる喋りではあったけど、まあネイティブじゃないからな、と、英語種を米国以外にあれこれ切り替えても拾えず。
それじゃあ、と、他のAndroid機よりは高性能な音声認識エンジン積んでる Pixel の音声入力試したら5割くらいは拾えるんだけど、途中で言語認識が英語からニポン語に自動で切り替わってた。
だいぶ流暢寄りでもAI的にはニポン語英語…ですらなく非英語と認識されてしまうものなんだなあ、へえ、となった。(むしろヒトとの会話では十二分 […]
言葉としてはサラサラ流暢で、発音は一部を除いてだいぶ米語に寄せてる喋りではあったけど、まあネイティブじゃないからな、と、英語種を米国以外にあれこれ切り替えても拾えず。
それじゃあ、と、他のAndroid機よりは高性能な音声認識エンジン積んでる Pixel の音声入力試したら5割くらいは拾えるんだけど、途中で言語認識が英語からニポン語に自動で切り替わってた。
だいぶ流暢寄りでもAI的にはニポン語英語…ですらなく非英語と認識されてしまうものなんだなあ、へえ、となった。(むしろヒトとの会話では十二分 […]
Original post on fedibird.com
fedibird.com
October 31, 2025 at 9:06 AM
興味深かったのが、ラップトップでのググるDocs経由の文字起こしは1割も拾ってくれず。
言葉としてはサラサラ流暢で、発音は一部を除いてだいぶ米語に寄せてる喋りではあったけど、まあネイティブじゃないからな、と、英語種を米国以外にあれこれ切り替えても拾えず。
それじゃあ、と、他のAndroid機よりは高性能な音声認識エンジン積んでる Pixel の音声入力試したら5割くらいは拾えるんだけど、途中で言語認識が英語からニポン語に自動で切り替わってた。
だいぶ流暢寄りでもAI的にはニポン語英語…ですらなく非英語と認識されてしまうものなんだなあ、へえ、となった。(むしろヒトとの会話では十二分 […]
言葉としてはサラサラ流暢で、発音は一部を除いてだいぶ米語に寄せてる喋りではあったけど、まあネイティブじゃないからな、と、英語種を米国以外にあれこれ切り替えても拾えず。
それじゃあ、と、他のAndroid機よりは高性能な音声認識エンジン積んでる Pixel の音声入力試したら5割くらいは拾えるんだけど、途中で言語認識が英語からニポン語に自動で切り替わってた。
だいぶ流暢寄りでもAI的にはニポン語英語…ですらなく非英語と認識されてしまうものなんだなあ、へえ、となった。(むしろヒトとの会話では十二分 […]
大阪・関西万博で体験!自動ドア開錠システム「key voice」#大阪府#AmiVoice#寝屋川市#大阪弁#WEST_inx
大阪・関西万博のWEST inxブースでは、AI音声認識技術を活用した自動ドア開錠システムが体験できる。来場者は大阪弁の発音に挑戦し扉を開く。子供から大人まで楽しめるこの展示に注目!
大阪・関西万博のWEST inxブースでは、AI音声認識技術を活用した自動ドア開錠システムが体験できる。来場者は大阪弁の発音に挑戦し扉を開く。子供から大人まで楽しめるこの展示に注目!
大阪・関西万博で体験!自動ドア開錠システム「key voice」
大阪・関西万博のWEST inxブースでは、AI音声認識技術を活用した自動ドア開錠システムが体験できる。来場者は大阪弁の発音に挑戦し扉を開く。子供から大人まで楽しめるこの展示に注目!
news.3rd-in.co.jp
April 23, 2025 at 4:25 AM
ChatGPTに教えてもらったNotebookLMチップス。
① YouTubeのURLにliveが入っていると挿入ボタンが有効にならない。そのときはURLを修正する。
youtube.com/live/[A]
↓
youtube.com/watch?v=[A]
(?si=以下は不要)
② それでもダメな場合は自動字幕がオンになっていないので、何らかのアプリで音声を録音してそのファイルをソースに追加する。(認識精度はかなり高い)
① YouTubeのURLにliveが入っていると挿入ボタンが有効にならない。そのときはURLを修正する。
youtube.com/live/[A]
↓
youtube.com/watch?v=[A]
(?si=以下は不要)
② それでもダメな場合は自動字幕がオンになっていないので、何らかのアプリで音声を録音してそのファイルをソースに追加する。(認識精度はかなり高い)
July 30, 2025 at 12:56 AM
ChatGPTに教えてもらったNotebookLMチップス。
① YouTubeのURLにliveが入っていると挿入ボタンが有効にならない。そのときはURLを修正する。
youtube.com/live/[A]
↓
youtube.com/watch?v=[A]
(?si=以下は不要)
② それでもダメな場合は自動字幕がオンになっていないので、何らかのアプリで音声を録音してそのファイルをソースに追加する。(認識精度はかなり高い)
① YouTubeのURLにliveが入っていると挿入ボタンが有効にならない。そのときはURLを修正する。
youtube.com/live/[A]
↓
youtube.com/watch?v=[A]
(?si=以下は不要)
② それでもダメな場合は自動字幕がオンになっていないので、何らかのアプリで音声を録音してそのファイルをソースに追加する。(認識精度はかなり高い)
今日のHuggingFaceトレンド
nvidia/canary-qwen-2.5b
このリポジトリは、自動音声認識(ASR)モデルの性能評価結果公開を目的に作成されました。
NemoライブラリのASRモデルについて、AMIやLibriSpeechなどの英語データセットにおけるWord Error Rate(WER)値とベンチマーク情報を提供します。
nvidia/canary-qwen-2.5b
このリポジトリは、自動音声認識(ASR)モデルの性能評価結果公開を目的に作成されました。
NemoライブラリのASRモデルについて、AMIやLibriSpeechなどの英語データセットにおけるWord Error Rate(WER)値とベンチマーク情報を提供します。
nvidia/canary-qwen-2.5b · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
July 22, 2025 at 10:20 AM
今日のHuggingFaceトレンド
nvidia/canary-qwen-2.5b
このリポジトリは、自動音声認識(ASR)モデルの性能評価結果公開を目的に作成されました。
NemoライブラリのASRモデルについて、AMIやLibriSpeechなどの英語データセットにおけるWord Error Rate(WER)値とベンチマーク情報を提供します。
nvidia/canary-qwen-2.5b
このリポジトリは、自動音声認識(ASR)モデルの性能評価結果公開を目的に作成されました。
NemoライブラリのASRモデルについて、AMIやLibriSpeechなどの英語データセットにおけるWord Error Rate(WER)値とベンチマーク情報を提供します。
今日のHuggingFaceトレンド
nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリを用いて開発された英語の自動音声認識モデルの性能を公開するために作成されています。
複数の標準的なデータセットに対する単語誤り率が、評価結果として示されています。
nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリを用いて開発された英語の自動音声認識モデルの性能を公開するために作成されています。
複数の標準的なデータセットに対する単語誤り率が、評価結果として示されています。
nvidia/parakeet-tdt-0.6b-v2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
May 16, 2025 at 10:18 AM
今日のHuggingFaceトレンド
nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリを用いて開発された英語の自動音声認識モデルの性能を公開するために作成されています。
複数の標準的なデータセットに対する単語誤り率が、評価結果として示されています。
nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリを用いて開発された英語の自動音声認識モデルの性能を公開するために作成されています。
複数の標準的なデータセットに対する単語誤り率が、評価結果として示されています。
記事の要約: スマート洗濯機市場は、2033年までに664億米ドルに達し、年平均成長率(CAGR)は20.5%と予測されています。この成長は、IoT統合、コネクテッドホームの普及、持続可能な家電トレンドに起因しています。特に、AIや音声認識技術の導入により、洗濯機は洗濯サイクルを自動調整し、省エネや効率性を向上させています。消費者は利便性や時間効率を重視し、特に若年層が多機能なスマート家電の需要を牽引しています。
市場はフロントロードとトップロードの製品、容量別(6kg未満、6~10kg、10kg以上)、用途別(住宅用、商業用)にセグメント化されており、持続的な成長が見込まれています。主要…
市場はフロントロードとトップロードの製品、容量別(6kg未満、6~10kg、10kg以上)、用途別(住宅用、商業用)にセグメント化されており、持続的な成長が見込まれています。主要…
「洗濯機 市場 洗濯機 市場」に関する記事です: https://newscast.jp/smart/news/5165425
スマート洗濯機市場は、IoT統合、コネクテッドホームの普及、持続可能な家電トレンドを背景に、2033年までに664億米ドルに達すると予測され、年平均成長率(CAGR)は20.5%となる見込みである
ニュースをメディアだけではなくSNSで拡散。ニュース、ニュースリリース、プレスリリース発信サービス
newscast.jp
October 18, 2025 at 10:38 AM
記事の要約: スマート洗濯機市場は、2033年までに664億米ドルに達し、年平均成長率(CAGR)は20.5%と予測されています。この成長は、IoT統合、コネクテッドホームの普及、持続可能な家電トレンドに起因しています。特に、AIや音声認識技術の導入により、洗濯機は洗濯サイクルを自動調整し、省エネや効率性を向上させています。消費者は利便性や時間効率を重視し、特に若年層が多機能なスマート家電の需要を牽引しています。
市場はフロントロードとトップロードの製品、容量別(6kg未満、6~10kg、10kg以上)、用途別(住宅用、商業用)にセグメント化されており、持続的な成長が見込まれています。主要…
市場はフロントロードとトップロードの製品、容量別(6kg未満、6~10kg、10kg以上)、用途別(住宅用、商業用)にセグメント化されており、持続的な成長が見込まれています。主要…
FIREが落ちたので、PCでユーチューブを見てるけど、
エアーウルフは無理だけど、ナイトライダーは現時点で実現可能じゃないかど思ったりするなぁヽ(^o^)丿
自動運転、音声認識、会話可能なAI・・・
ジャンプ機能は難しそうだけどヽ(^o^)丿
エアーウルフは無理だけど、ナイトライダーは現時点で実現可能じゃないかど思ったりするなぁヽ(^o^)丿
自動運転、音声認識、会話可能なAI・・・
ジャンプ機能は難しそうだけどヽ(^o^)丿
April 26, 2024 at 5:25 PM
FIREが落ちたので、PCでユーチューブを見てるけど、
エアーウルフは無理だけど、ナイトライダーは現時点で実現可能じゃないかど思ったりするなぁヽ(^o^)丿
自動運転、音声認識、会話可能なAI・・・
ジャンプ機能は難しそうだけどヽ(^o^)丿
エアーウルフは無理だけど、ナイトライダーは現時点で実現可能じゃないかど思ったりするなぁヽ(^o^)丿
自動運転、音声認識、会話可能なAI・・・
ジャンプ機能は難しそうだけどヽ(^o^)丿
相変わらず「総務省です。この電話は2時間後に使えなくなります」が掛かってくる。
完全無視してるんじゃが、即切りした方が掛かって来ないんかねえ?
自動応答だから放置してるんじゃが、全部聞いてから切れるんで、聞いてると認識されてんのか?ウザっ
ーあ、これ完全詐欺電話ですから相手しちゃ駄目ッスよ。
2時間経っても使えますし、
総務省ならもっと前に通達しろやって事ですし、電子音声とか失礼極まる話だし、そもそも書面で通達しろやって話ですし。
あと自動応答は「迷惑電話対策モードです」みたいな事を電話が勝手に言うんじゃよ。
知らない電話番号だと自動的になる。
完全無視してるんじゃが、即切りした方が掛かって来ないんかねえ?
自動応答だから放置してるんじゃが、全部聞いてから切れるんで、聞いてると認識されてんのか?ウザっ
ーあ、これ完全詐欺電話ですから相手しちゃ駄目ッスよ。
2時間経っても使えますし、
総務省ならもっと前に通達しろやって事ですし、電子音声とか失礼極まる話だし、そもそも書面で通達しろやって話ですし。
あと自動応答は「迷惑電話対策モードです」みたいな事を電話が勝手に言うんじゃよ。
知らない電話番号だと自動的になる。
November 21, 2024 at 12:43 AM
相変わらず「総務省です。この電話は2時間後に使えなくなります」が掛かってくる。
完全無視してるんじゃが、即切りした方が掛かって来ないんかねえ?
自動応答だから放置してるんじゃが、全部聞いてから切れるんで、聞いてると認識されてんのか?ウザっ
ーあ、これ完全詐欺電話ですから相手しちゃ駄目ッスよ。
2時間経っても使えますし、
総務省ならもっと前に通達しろやって事ですし、電子音声とか失礼極まる話だし、そもそも書面で通達しろやって話ですし。
あと自動応答は「迷惑電話対策モードです」みたいな事を電話が勝手に言うんじゃよ。
知らない電話番号だと自動的になる。
完全無視してるんじゃが、即切りした方が掛かって来ないんかねえ?
自動応答だから放置してるんじゃが、全部聞いてから切れるんで、聞いてると認識されてんのか?ウザっ
ーあ、これ完全詐欺電話ですから相手しちゃ駄目ッスよ。
2時間経っても使えますし、
総務省ならもっと前に通達しろやって事ですし、電子音声とか失礼極まる話だし、そもそも書面で通達しろやって話ですし。
あと自動応答は「迷惑電話対策モードです」みたいな事を電話が勝手に言うんじゃよ。
知らない電話番号だと自動的になる。
そういえば、上海のホテルでフロントに行ったら自動翻訳アプリをひらいたスマホを渡されて、しゃべりたいこと咄嗟に出てこず(え、待って、これって英語の音声認識?おれが英語しゃべって認識される?いや、早く何か言わないと) "uh..." ってなったの、自分のことながらなんか笑えた(情弱?)
March 11, 2025 at 4:06 PM
そういえば、上海のホテルでフロントに行ったら自動翻訳アプリをひらいたスマホを渡されて、しゃべりたいこと咄嗟に出てこず(え、待って、これって英語の音声認識?おれが英語しゃべって認識される?いや、早く何か言わないと) "uh..." ってなったの、自分のことながらなんか笑えた(情弱?)
mocomoco、音声認識AIに校正機能を追加し品質向上を実現!#東京都#港区#音声認識#mocomoco#mocoVoice_API
mocomocoが開発した音声認識AI『mocoVoice API』に新しい校正・校閲機能が加わりました。この機能により、音声をテキスト化するだけでなく、正確かつ読みやすい文章への自動整形が実現。
mocomocoが開発した音声認識AI『mocoVoice API』に新しい校正・校閲機能が加わりました。この機能により、音声をテキスト化するだけでなく、正確かつ読みやすい文章への自動整形が実現。
mocomoco、音声認識AIに校正機能を追加し品質向上を実現!
mocomocoが開発した音声認識AI『mocoVoice API』に新しい校正・校閲機能が加わりました。この機能により、音声をテキスト化するだけでなく、正確かつ読みやすい文章への自動整形が実現。
news.3rd-in.co.jp
April 11, 2025 at 6:28 AM
mocomoco、音声認識AIに校正機能を追加し品質向上を実現!#東京都#港区#音声認識#mocomoco#mocoVoice_API
mocomocoが開発した音声認識AI『mocoVoice API』に新しい校正・校閲機能が加わりました。この機能により、音声をテキスト化するだけでなく、正確かつ読みやすい文章への自動整形が実現。
mocomocoが開発した音声認識AI『mocoVoice API』に新しい校正・校閲機能が加わりました。この機能により、音声をテキスト化するだけでなく、正確かつ読みやすい文章への自動整形が実現。
今日のHuggingFaceトレンド
nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリによる自動音声認識モデルを扱います。
様々な英語データセットでの音声認識精度(WER)が記載されています。
nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリによる自動音声認識モデルを扱います。
様々な英語データセットでの音声認識精度(WER)が記載されています。
nvidia/parakeet-tdt-0.6b-v2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
May 8, 2025 at 10:18 AM
今日のHuggingFaceトレンド
nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリによる自動音声認識モデルを扱います。
様々な英語データセットでの音声認識精度(WER)が記載されています。
nvidia/parakeet-tdt-0.6b-v2
このリポジトリは、Nemoライブラリによる自動音声認識モデルを扱います。
様々な英語データセットでの音声認識精度(WER)が記載されています。
NVIDIAの自動音声認識モデルParakeetをサポートし、最新のMacで最大300倍高速に英語の文字起こしが可能になったAI文字起こしアプリ「MacWhisper v12.12」がリリース。 | AAPL Ch. applech2.com/archives/202...
NVIDIAの自動音声認識モデルParakeetをサポートし、最新のMacで最大300倍高速に英語の文字起こしが可能になったAI文字起こしアプリ「MacWhisper v12.12」がリリース。
Good Snoozeは現地時間2025年06月26日、新たに音声認識モデルParakeet(パラキート)をサポートした「MacWhisper v12.2」をリリースしたと発表しています。
applech2.com
July 1, 2025 at 12:39 AM
NVIDIAの自動音声認識モデルParakeetをサポートし、最新のMacで最大300倍高速に英語の文字起こしが可能になったAI文字起こしアプリ「MacWhisper v12.12」がリリース。 | AAPL Ch. applech2.com/archives/202...
GIGAZINE より
元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表
ElevenLabs, a former Google engineer, unveils the world's most accurate voice recognition model, Scribe
元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表
ElevenLabs, a former Google engineer, unveils the world's most accurate voice recognition model, Scribe
元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表 - GIGAZINE
ElevenLabs, a former Google engineer, unveils the world's most accurate automatic voice recognition model - GIGAZINE
元Googleの機械学習エンジニアであるピオトル・ドンブコウスキー氏らによって設立され、1億8000万ドル(約270億円)の資金調達を終えたばかりのAIスタートアップのElevenLabsが、世界で最も正確な自動音声認識(ASR)モデルの「Scribe」を発表しました。
gigazine.net
February 27, 2025 at 2:16 AM
GIGAZINE より
元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表
ElevenLabs, a former Google engineer, unveils the world's most accurate voice recognition model, Scribe
元GoogleのエンジニアによるElevenLabsが世界で最も正確な自動音声認識モデル「Scribe」を発表
ElevenLabs, a former Google engineer, unveils the world's most accurate voice recognition model, Scribe
完全オフライン環境で議事録作成を実現した新ソフト登場#東京都#港区#楽々ぎじろー君Pro#オフライン議事録#Tokyo_Properties
Tokyo Propertiesから新たに登場した『楽々ぎじろー君Pro+AI要約』が、完全オフライン環境で効率的な議事録作成を実現。音声認識機能とAIによる自動要約で業務が楽に。
Tokyo Propertiesから新たに登場した『楽々ぎじろー君Pro+AI要約』が、完全オフライン環境で効率的な議事録作成を実現。音声認識機能とAIによる自動要約で業務が楽に。
完全オフライン環境で議事録作成を実現した新ソフト登場
Tokyo Propertiesから新たに登場した『楽々ぎじろー君Pro+AI要約』が、完全オフライン環境で効率的な議事録作成を実現。音声認識機能とAIによる自動要約で業務が楽に。
news.3rd-in.co.jp
March 3, 2025 at 2:44 AM
完全オフライン環境で議事録作成を実現した新ソフト登場#東京都#港区#楽々ぎじろー君Pro#オフライン議事録#Tokyo_Properties
Tokyo Propertiesから新たに登場した『楽々ぎじろー君Pro+AI要約』が、完全オフライン環境で効率的な議事録作成を実現。音声認識機能とAIによる自動要約で業務が楽に。
Tokyo Propertiesから新たに登場した『楽々ぎじろー君Pro+AI要約』が、完全オフライン環境で効率的な議事録作成を実現。音声認識機能とAIによる自動要約で業務が楽に。
旧Google Home Miniの車載をやめることにした
音声認識自動ツイートできなくなって久しいし、予定確認するくらいならiPhoneのSiriでええやんけと気が付いてしまった
Apple Intelligenceに期待
音声認識自動ツイートできなくなって久しいし、予定確認するくらいならiPhoneのSiriでええやんけと気が付いてしまった
Apple Intelligenceに期待
March 12, 2025 at 12:10 PM
旧Google Home Miniの車載をやめることにした
音声認識自動ツイートできなくなって久しいし、予定確認するくらいならiPhoneのSiriでええやんけと気が付いてしまった
Apple Intelligenceに期待
音声認識自動ツイートできなくなって久しいし、予定確認するくらいならiPhoneのSiriでええやんけと気が付いてしまった
Apple Intelligenceに期待
ハブミニを増設したのでもう中途半端に使えないとか無いんだぜいえーーーい カーテンも自動で開くしほぼ想定通りのスマートホーム化完成かな〜〜〜あとはアレクサだかなんだかの音声認識をちゃんとしたやつにするだけ!なにがいいのかなーーーー
June 16, 2025 at 12:49 PM
ハブミニを増設したのでもう中途半端に使えないとか無いんだぜいえーーーい カーテンも自動で開くしほぼ想定通りのスマートホーム化完成かな〜〜〜あとはアレクサだかなんだかの音声認識をちゃんとしたやつにするだけ!なにがいいのかなーーーー
Switchボットやハブなどを手に入れたので朝自動でカーテン開けたり電気つくようになったし寝落ちても手元で部屋の電気消せるようになった✌️明日はEchoPopも来るので音声認識もできるようになるぞ
August 10, 2025 at 10:50 AM
Switchボットやハブなどを手に入れたので朝自動でカーテン開けたり電気つくようになったし寝落ちても手元で部屋の電気消せるようになった✌️明日はEchoPopも来るので音声認識もできるようになるぞ