スピーチテクノロジーに関する最新の記事

サウンド MMSD-Netで吃音検出を改善する

音声、映像、テキストデータを組み合わせて、吃音の検出を強化する新しい方法が登場したよ。

2025-07-15T07:18:40+00:00 ― 1 分で読む

音声・音声処理ポーランド語の音声認識を改善する

研究がポーランド語の音声認識システムを評価する新しい方法を提案している。

2025-07-14T16:44:10+00:00 ― 1 分で読む

音声・音声処理 MSceneSpeech: マンダリン音声合成の進展

新しいデータセットがマンダリンの機械音声を向上させて、自然な表現を目指してるよ。

2025-07-14T09:26:55+00:00 ― 1 分で読む

サウンドデジタルメディアにおけるスピーチ編集の台頭

コンテンツクリエイターにとってスピーチ編集の重要性が高まってるよね。

2025-07-11T00:28:35+00:00 ― 1 分で読む

計算と言語リソースが少ない言語の音声認識の進歩

新しい方法が、あまり代表されていない言語の音声システムを改善してるよ。

2025-07-10T04:14:00+00:00 ― 1 分で読む

サウンド音声検出技術の進展

研究は、より良いアンチスプーフィングシステムのために音声強化と転移学習を組み合わせている。

2025-07-08T23:53:35+00:00 ― 1 分で読む

音声・音声処理感情的なスピーチ生成の進展

新しい方法が機械の音声合成における感情表現を強化してるよ。

2025-07-05T22:12:30+00:00 ― 1 分で読む

計算と言語 Speech-MASSIVEを紹介するよ：多言語の話し言葉理解のための新しいデータセットだよ。

Speech-MASSIVEは、いろんな言語の話し言葉の理解を向上させることを目指してるんだ。

2025-07-04T01:40:25+00:00 ― 1 分で読む

音声・音声処理新しい方法でスピーチデータのプライバシーを守る

革新的な技術が、処理精度を維持しながら敏感な音声データを保護するんだ。

2025-07-04T00:51:50+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション OpenOmni：マルチモーダル会話エージェントの進化

OpenOmniは、会話エージェントを作成・テストするための柔軟なツールを作ってるよ。

2025-07-01T09:40:42+00:00 ― 1 分で読む

音声・音声処理 SSL-TTSを使った音声合成技術の進展

SSL-TTSは、少ないトレーニングデータで高品質な音声合成を簡単にするよ。

2025-06-27T15:49:35+00:00 ― 1 分で読む

音声・音声処理ささやき音声認識技術の進展

新しい方法が囁きコミュニケーションの音声認識を向上させる。

2025-06-25T05:31:35+00:00 ― 1 分で読む

サウンドスタイルスピーチ: テキスト読み上げ技術の未来

StyleSpeechは、自然な話し方のニュアンスを捉えることでTTSシステムを進化させる。

2025-06-24T14:08:30+00:00 ― 1 分で読む

サウンドエモアタック: スピーチテクノロジーの新しい脅威

EmoAttackは感情音声変換を利用して、スピーチシステムの脆弱性を突く。

2025-06-24T01:59:45+00:00 ― 1 分で読む

音声・音声処理マスクサイクルGANを使ったささやき音声変換の進展

新しい方法が、先進的な技術を使ってささやき声を普通の声に変換するのを改善したんだ。

2025-06-23T09:48:05+00:00 ― 1 分で読む

サウンド VoxInstruct: スピーチを生成する新しい方法

VoxInstructは、コンテンツとスタイルを組み合わせて、より自然なスピーチ生成を実現するんだ。

2025-06-22T23:16:30+00:00 ― 1 分で読む

サウンド Whisperを使ったスピーカーバリフィケーションの進展

新しい方法が複数の言語での音声認識精度を向上させる。

2025-06-22T18:25:00+00:00 ― 1 分で読む

音声・音声処理時間文脈ウィンドウを使った音声強調の進展

時間コンテキストウィンドウを使ってスピーチの質を向上させる新しいアプローチを探ってるんだ。

2025-06-22T17:36:25+00:00 ― 1 分で読む

サウンド音声合成技術の進歩

新しい方法がTTSシステムの音声合成の品質を向上させる。

2025-06-22T05:27:40+00:00 ― 1 分で読む

音声・音声処理 SelectTTSの紹介：シンプルなテキスト読み上げ方法

SelectTTSは、見知らぬ話者のためのスピーチ生成を効果的なフレーム選択で簡単にするよ。

2025-06-21T18:07:30+00:00 ― 1 分で読む

音声・音声処理音声処理のための自己教師あり学習の進展

新しい方法で、いろんなタスクでスピーチモデルのパフォーマンスが向上したよ。

2025-06-21T02:44:25+00:00 ― 1 分で読む

サウンドラベルなしデータでキーワードスポッティングを進化させる

新しい方法が、ラベル付けされていない音声データを使ってキーワードスポッティングの精度を向上させた。

2025-06-21T01:55:50+00:00 ― 1 分で読む

ニューロンと認知音声分析による軽度認知障害の自動検出

研究によると、スピーチ分析が軽度認知障害の早期発見に役立つことが分かってるよ。

2025-06-21T01:11:33+00:00 ― 1 分で読む

サウンド新しいデータセットが音声認識技術を向上させる

研究者たちは、騒がしい環境での音声認識を改善するためにLibriheavyMixを作り出した。

2025-06-20T22:41:30+00:00 ― 1 分で読む

計算と言語音声トークン化の進展：評価のためのフレームワーク

新しいベンチマークがスピーチトークナイザーの性能評価を手助けするよ。

2025-06-20T00:01:10+00:00 ― 1 分で読む

計算と言語自閉症診断のためのスピーチデータの活用

新しい方法が音声データを活用して自閉症の評価を改善するんだって。

2025-06-19T19:12:12+00:00 ― 1 分で読む

音声・音声処理 DDSPを使った音声合成の進展

DDSPが音声合成の効率と品質をどう向上させるかを発見しよう。

2025-06-18T17:15:00+00:00 ― 1 分で読む

計算と言語音声言語モデルにおけるスピーカー認識の課題

SpeechLLMは期待できるけど、会話の中で話者の特定が苦手なんだよね。

2025-06-17T08:03:05+00:00 ― 1 分で読む

音声・音声処理限られたリソースでの音声モデルの効率的なトレーニング

この記事では、自己教師あり学習を使った音声モデルの効率的なトレーニング方法について話してるよ。

2025-06-16T15:02:50+00:00 ― 1 分で読む

計算と言語インドの言語のためのスピーチシステムの改善

新しいデータセットがインドの多言語スピーチ技術を向上させる。

2025-06-15T18:48:15+00:00 ― 1 分で読む

サウンド感情豊かなテキスト読み上げ技術の進歩

ParaEVITSは、自然言語ガイダンスを通じてTTSの感情表現を向上させる。

2025-06-15T05:50:55+00:00 ― 1 分で読む

計算と言語ファイタール語の音声認識の進展

資源が乏しいファエター語のための音声技術改善の取り組み。

2025-06-13T09:18:50+00:00 ― 1 分で読む

計算と言語 WhisperNER: 音声認識とエンティティ検出の統合

新しいモデルは、音声認識とエンティティ認識を組み合わせて、より良い結果を出すよ。

2025-06-13T03:29:30+00:00 ― 1 分で読む

音声・音声処理障害のある人のための音声認識の進歩

プロジェクトは、コミュニケーションに困難がある人たちのためにスピーチ技術を改善することを目指している。

2025-06-12T12:15:40+00:00 ― 1 分で読む

サウンドテキスト読み上げ技術でのアクセント改善

新しいシステムがTTSのアクセント精度を向上させて、コミュニケーションをより良くするよ。

2025-06-12T08:12:45+00:00 ― 1 分で読む

サウンド ESPnet-EZ: スピーチモデル開発を簡単にする

複雑なコードなしでスピーチモデルを微調整するのに使いやすいツール。

2025-06-11T15:12:30+00:00 ― 1 分で読む

量子物理学量子コンピュータで音声認識を進化させる

データプライバシーを守りながら音声認識を改善する新しい方法。

2025-06-11T07:18:42+00:00 ― 1 分で読む

サウンドアクセント変換技術の進展

テキスト音写を使ってアクセント付きの音声を生成する新しい方法。

2025-06-11T06:18:05+00:00 ― 1 分で読む

音声・音声処理 Wave-U-Mambaでスピーチの質を改善する

Wave-U-Mambaは、低品質の音声録音を強化して、よりクリアなコミュニケーションを提供するよ。

2025-06-11T04:40:55+00:00 ― 1 分で読む

サウンド音声品質評価の進展

新しいシステムが革新的な方法を使って合成音声の自然さスコアを予測するんだ。

2025-06-11T03:52:20+00:00 ― 1 分で読む

スピーチテクノロジー に関する最新の記事

スピーチテクノロジーに関する最新の記事