音声認識に関する最新の記事

計算と言語テキストインジェクションで自動音声認識を改善する

新しい手法がテキストデータの統合を通じてASRの性能を向上させる。

2025-09-26T07:33:00+00:00 ― 1 分で読む

計算と言語テキストインジェクションで音声認識を改善する

テキストインジェクションは、プライバシーを守りつつ個人情報を認識するのに役立つよ。

2025-09-26T06:44:25+00:00 ― 1 分で読む

サウンド mmWave技術による音声認識の進歩

Radio2Textは、騒がしい環境でのリアルタイム音声認識にmmWave信号を使ってるよ。

2025-09-25T22:38:35+00:00 ― 1 分で読む

計算と言語新しいサンプリング方法で音素変換を改善する

この研究は、トレーニング中にエラーが起こりやすい部分に注目することでG2Pモデルを強化してるよ。

2025-09-25T05:38:20+00:00 ― 1 分で読む

音声・音声処理フォルマントトラッキング技術の進展

スピーチ分析のためのフォルマントトラッキングの精度を向上させる方法を見つけよう。

2025-09-24T22:21:05+00:00 ― 1 分で読む

計算と言語音声言語モデリングの進展

新しい方法が言語モデルのスピーチ処理と生成を改善してるよ。

2025-09-19T16:02:05+00:00 ― 1 分で読む

サウンドノイズ抑制技術の進歩

新しい技術で騒がしい環境でも音声がクリアに聞こえるようになったよ。

2025-09-19T15:13:30+00:00 ― 1 分で読む

音声・音声処理リーディングスピーチデータを使った少数ショットキーワードスポッティングの進展

新しい方法で、利用可能な読み上げ音声データを使ってキーワードスポッティングが向上したよ。

2025-09-19T13:36:20+00:00 ― 1 分で読む

音声・音声処理自動音声認識における信頼度推定の向上

新しいアプローチがASRシステムの自信推定を強化して、精度を向上させる。

2025-09-15T03:14:28+00:00 ― 1 分で読む

機械学習音声フィルタバンク設計におけるConvnetの利用に関する課題

この研究は、オーディオフィルターバンク作成におけるコンボリューショナルネットワーク（convnet）の使用に関する問題を探っているよ。

2025-09-14T14:34:35+00:00 ― 1 分で読む

音声・音声処理言語モデルを使ったスピーカー分離の改善

この記事では、より高い精度を目指したスピーカーダイアライゼーションの進展について言語モデルを使って探ります。

2025-09-14T03:14:25+00:00 ― 1 分で読む

音声・音声処理 PromptASR: ネクスレベルの音声認識技術

新しいシステムは文脈に応じたプロンプトを使って音声認識を強化するよ。

2025-09-13T10:14:10+00:00 ― 1 分で読む

サウンドユニバーサルオーディオモデルの進展

EnCodecMAEは、自己教師あり学習とオーディオコーデックを組み合わせて、オーディオタスクのパフォーマンスを向上させるんだ。

2025-09-13T09:25:35+00:00 ― 1 分で読む

音声・音声処理キーワード発見の新しいアプローチ

言語を超えてスピーチのキーワードを認識する柔軟な方法を紹介します。

2025-09-13T06:11:15+00:00 ― 1 分で読む

サウンド新しいシステムが不安定な頭の位置からの音声抽出を改善するよ。

PIAVEは、話し手が顔を背けても機械が声をクリアに抽出するのを助けるよ。

2025-09-12T19:39:40+00:00 ― 1 分で読む

サウンドスピーカー匿名化の新しいフレームワーク

音声プライバシー研究を強化するための柔軟なフレームワークを紹介します。

2025-09-12T05:05:10+00:00 ― 1 分で読む

計算と言語スピーチモデルの説明を改善する

新しい方法がスピーチ分類モデルの理解を簡単にするよ。

2025-09-12T02:39:25+00:00 ― 1 分で読む

サウンド M-AUDIODEC: 音声を圧縮する新しい方法

M-AUDIODECは、スピーカーの位置と音質を保ちながらマルチチャネルオーディオを圧縮するよ。

2025-09-11T16:56:25+00:00 ― 1 分で読む

音声・音声処理イヤフォンの音質を改善する

研究がスマートイヤフォンの音声クリアさを高める新しいモデルを明らかにした。

2025-09-11T12:04:55+00:00 ― 0 分で読む

人工知能人間の指示をロボットがもっと理解できるようにすること

新しい方法でロボットが話された指示を正確に追う能力が向上したよ。

2025-09-11T08:21:18+00:00 ― 1 分で読む

音声・音声処理偽のスピーチ検出技術の進展

新しい方法が、偽のスピーチを効果的に検出する能力を向上させてるよ。

2025-09-11T02:21:55+00:00 ― 1 分で読む

サウンドパーソナライズ技術で音声認識を向上させる

新しい方法が、量子化と適応を使って、個々のユーザー向けにASRモデルを強化するよ。

2025-09-10T13:24:35+00:00 ― 1 分で読む

音声・音声処理早期脱出モデルによる音声認識の進展

新しいモデルは、音声認識の効率と応答性を改善するために適応してるよ。

2025-09-09T21:12:55+00:00 ― 1 分で読む

音声・音声処理リソースが少ない言語のためのWhisperの改善

ベトナム語や他のリソースが少ない言語のために、Whisperの音声認識を強化中。

2025-09-08T03:55:10+00:00 ― 1 分で読む

神経科学困難な環境での音声処理の理解

この研究は、聴覚能力が騒がしい環境での言葉の理解にどう影響するかを調べてるよ。

2025-09-07T04:34:28+00:00 ― 1 分で読む

音声・音声処理 K-meansクラスタリングで音声データセットを改善する

オーディオデータを最適化してモデルのトレーニングを良くするためにk-meansクラスタリングを使う。

2025-09-06T15:28:55+00:00 ― 1 分で読む

音声・音声処理音声認識の効率的なモデル選択

音声特徴に基づいて最適なASRモデルを選ぶ方法。

2025-09-05T23:17:15+00:00 ― 1 分で読む

計算と言語私のサイエンスチュータープロジェクト: 学び方の新しいスタイル

MySTは子供たちの科学学習をバーチャルチュータリングで向上させることを目指しているよ。

2025-09-05T09:31:20+00:00 ― 1 分で読む

サウンド会議の文字起こし技術の進歩

M2MeT 2.0とその会議トランスクリプションへの影響についての考察。

2025-09-05T03:51:15+00:00 ― 1 分で読む

音声・音声処理音声認識モデルの進展と課題

この研究は、モデル圧縮が騒がしい環境での音声認識にどのように影響するかを調べている。

2025-09-04T19:45:25+00:00 ― 1 分で読む

サウンド音声認識モデルの進展

新しいモデルが、音声と音の理解を同時に改善するんだ。

2025-09-04T18:08:15+00:00 ― 0 分で読む

音声・音声処理音声抽出技術の進歩

騒がしい環境でのスピーチ抽出をもっと良くする新しいモデルを紹介します。

2025-09-04T02:45:10+00:00 ― 1 分で読む

計算と言語長文の自動音声認識の課題に対処する

研究は、セグメント化されていない音声のためのASRシステムの改善に焦点を当てている。

2025-09-03T13:47:50+00:00 ― 1 分で読む

計算と言語音声認識技術における性別バイアスの対処

異なる性別間での音声認識のパフォーマンスギャップを調査する。

2025-09-03T12:51:42+00:00 ― 0 分で読む

計算と言語大規模言語モデルで音声認識を改善する

LLMは音声認識システムの精度とエラー修正を向上させるんだ。

2025-09-03T06:30:35+00:00 ― 1 分で読む

音声・音声処理 PP-MeTシステムで会議の文字起こしを改善する

PP-MeTは、複数の話者がいる会議の文字起こしの精度を向上させることを目指しているよ。

2025-09-02T04:35:55+00:00 ― 1 分で読む

音声・音声処理音声強化の普遍的アプローチ

この研究は、いろんな条件でスピーチの明瞭さを改善するモデルを提示してるよ。

2025-09-02T02:10:10+00:00 ― 1 分で読む

計算と言語コードスイッチング音声認識の進展

このプロジェクトは、グジャラート語と英語が混ざったスピーチの認識を向上させることを目指してるよ。

2025-08-30T05:46:00+00:00 ― 1 分で読む

計算と言語マルチモーダルデータを使った音声分類の進展

新しいモデルは、音声とテキストを統合して、より良いスピーチ分類を実現してるよ。

2025-08-29T18:49:00+00:00 ― 1 分で読む

サウンド NOTSOFAR-1チャレンジ：ミーティング文字起こし技術の進化

大きな部屋での会議用にトランスクリプション技術を改善する新しい取り組み。

2025-08-29T16:23:15+00:00 ― 1 分で読む

音声認識 に関する最新の記事

音声認識に関する最新の記事