音声認識に関する最新の記事

音声・音声処理音声処理のためのフォルマントトラッキングの進展

新しい単一ステップの方法が、音声のフォーマント追跡の精度を向上させるよ。

2025-09-19T02:16:10+00:00 ― 1 分で読む

計算と言語スピーチと言語モデルをつなぐ：BLSPメソッド

新しいアプローチが音声と言語モデルの統合を強化する。

2025-09-18T15:44:35+00:00 ― 1 分で読む

音声・音声処理 VoxtLM：音声とテキストの統一アプローチ

VoxtLMは、音声認識、合成、テキスト生成、そして継続を1つのモデルにまとめているよ。

2025-09-13T11:02:45+00:00 ― 1 分で読む

音声・音声処理 Libriheavy: 音声認識のための新しいデータセット

Libriheavyは、音声認識技術を向上させるために5万時間の英語音声を提供してるよ。

2025-09-12T18:51:05+00:00 ― 1 分で読む

サウンドソフトプロンプトで音声認識を改善する

ソフトプロンプトは、騒がしい環境での音声認識技術のパフォーマンスを向上させるんだ。

2025-09-10T04:30:10+00:00 ― 0 分で読む

計算と言語音声認識の進化：指示に従うシステム

新しい音声認識のアプローチは、柔軟な指示でユーザーとのインタラクションを向上させる。

2025-09-09T08:15:35+00:00 ― 1 分で読む

サウンドテスト時のトレーニングで音声認識を改善する

TTTが分布の変化に適応することで、音声認識がどう向上するかを探ってみよう。

2025-09-08T14:26:45+00:00 ― 1 分で読む

音声・音声処理残響除去技術でスピーチの明瞭度を向上させる

ノイズがうるさい環境でスピーチ認識を向上させるデレバーバレーションの学び方。

2025-09-05T12:45:40+00:00 ― 1 分で読む

サウンド音声認識モデルの進展

新しいモデルが、音声と音の理解を同時に改善するんだ。

2025-09-04T18:08:15+00:00 ― 0 分で読む

音声・音声処理多様なアクセントの音声認識を改善する

さまざまなアクセントをよりよく認識して適応できるようにスピーチモデルを強化する。

2025-09-04T08:25:15+00:00 ― 1 分で読む

計算と言語インドの言語の音声認識を作ること

インドの多様な言語での音声認識を向上させるプロジェクト。

2025-09-01T15:10:24+00:00 ― 1 分で読む

計算と言語カラーマプロジェクト：農業における言語と技術の架け橋

Kallaamaはセネガルの農家を支援するために、地元の言語でスピーチデータセットを作成しているよ。

2025-08-23T02:43:54+00:00 ― 1 分で読む

計算と言語 NLPにおける先住民言語の課題とチャンス

先住民族の言語はテクノロジーでの課題に直面してるけど、豊かな文化的洞察を提供してるよ。

2025-08-21T07:40:36+00:00 ― 1 分で読む

ロボット工学ヘルスケアにおけるソーシャルロボットの評価

高齢者デイケア施設でのARIの使用に関する研究。

2025-08-20T09:17:36+00:00 ― 1 分で読む

計算と言語音声データを使ってソラニ・クルド語の方言を分類する

研究は、広範な音声録音を使用してソラニ・クルド語の方言を特定し、分類している。

2025-08-14T07:57:50+00:00 ― 1 分で読む

計算と言語生成的融合デコーディング：テキスト認識の進化

新しい方法が、いろんなアプリでのテキスト認識の精度を上げるんだ。

2025-08-07T22:00:54+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションロボットコミュニケーションの進化：重なり声解決法

新しいシステムは、重なっているスピーチをフィルタリングすることでロボットのインタラクションを改善する。

2025-08-04T13:57:15+00:00 ― 1 分で読む

音声・音声処理動的TTAを使った自動音声認識の進展

新しい方法で、騒がしい環境でもスピーチ認識が良くなる適応技術が使われてるんだ。

2025-07-29T13:49:25+00:00 ― 1 分で読む

計算と言語コードスイッチング音声翻訳の進展

新しい方法で混合言語のスピーチを英語に翻訳するのが上手くなったよ。

2025-07-29T09:46:30+00:00 ― 1 分で読む

音声・音声処理 GigaSpeech 2: 音声認識のための新しいデータセット

GigaSpeech 2は、音声認識を改善するためのリソースの少ない言語向けの膨大なデータセットを提供してるよ。

2025-07-29T02:29:15+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 BabyViewデータセット：子どもの学習を新たに見る

子供たちの日常を捉えたユニークなデータセットが、機械学習や人間の学習の理解を深めるために作られてるんだ。

2025-07-29T01:16:42+00:00 ― 1 分で読む

計算と言語生成AIシステム：コンテンツ制作の未来を切り拓く

生成AIがコンテンツの作り方をどう変えてるかを発見しよう。

2025-07-24T05:01:00+00:00 ― 1 分で読む

計算と言語自動音声認識技術の進展

新しい方法が音声認識システムの精度と効率を向上させる。

2025-07-22T03:41:05+00:00 ― 1 分で読む

サウンドコミュニケーションの進化：音声認識がモールス信号と出会う

新しいモデルは、音声認識とモールス信号を使って、障害のある人たちのコミュニケーションを強化するんだ。

2025-07-18T02:52:00+00:00 ― 1 分で読む

音声・音声処理 Qwen2-Audio: テクノロジーの新しい声

音声駆動型モデルがテクノロジーとの音声インタラクションを変革中。

2025-07-16T00:18:55+00:00 ― 1 分で読む

音声・音声処理 Vibravox: スピーチ認識技術の進化

新しいデータセットは、身体伝導センサーを使って音声キャプチャを改善することを目的としてるよ。

2025-07-15T14:35:55+00:00 ― 1 分で読む

音声・音声処理ポーランド語の音声認識を改善する

研究がポーランド語の音声認識システムを評価する新しい方法を提案している。

2025-07-14T16:44:10+00:00 ― 1 分で読む

ニューロンと認知音声回復のためのEEG技術の進展

研究者たちがEEGを使って話す能力を改善する方法を進化させて、話すのに困難がある人たちを助けてるんだ。

2025-07-12T16:20:33+00:00 ― 1 分で読む

計算と言語多言語オーラルヒストリーにおける音声認識の評価

この研究は、オーラルヒストリーのために異なる言語を使った音声認識システムを評価してる。

2025-07-07T12:29:12+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション OpenOmni：マルチモーダル会話エージェントの進化

OpenOmniは、会話エージェントを作成・テストするための柔軟なツールを作ってるよ。

2025-07-01T09:40:42+00:00 ― 1 分で読む

計算と言語クロスリンガルスピーチ要約技術の改善

研究は、言語を超えた話し言葉の会話のより良い要約に焦点を当てている。

2025-06-29T05:24:24+00:00 ― 1 分で読む

サウンド NESTの紹介：音声処理の新しいモデル

NESTは、自己教師あり音声タスクに対してより速く、効率的なアプローチを提供してるよ。

2025-06-25T20:06:05+00:00 ― 1 分で読む

人工知能エラー予測による音声認識の改善

研究は、より正確な音声認識のためのエラー予測に焦点を当てている。

2025-06-25T10:09:42+00:00 ― 0 分で読む

計算と言語ヒンディー語音声認識の新しいベンチマーク

研究が多様なアクセントを持つヒンディー語の音声認識を改善する。

2025-06-24T05:11:42+00:00 ― 1 分で読む

サウンド Whisperを使ったスピーカーバリフィケーションの進展

新しい方法が複数の言語での音声認識精度を向上させる。

2025-06-22T18:25:00+00:00 ― 1 分で読む

サウンド新しいデータセットが音声認識技術を向上させる

研究者たちは、騒がしい環境での音声認識を改善するためにLibriheavyMixを作り出した。

2025-06-20T22:41:30+00:00 ― 1 分で読む

音声・音声処理スピーチ処理タスクにおけるマambaモデルの評価

この研究は、Mambaのスピーチタスクにおけるパフォーマンスを分析していて、音の再構築と認識に重点を置いてるんだ。

2025-06-14T23:22:15+00:00 ― 1 分で読む

音声・音声処理音響ランドマーク：音声処理のための新しいデータセット

研究者たちが音声認識と分析技術を向上させるためのデータセットを開発した。

2025-06-13T19:50:25+00:00 ― 1 分で読む

計算と言語ファイタール語の音声認識の進展

資源が乏しいファエター語のための音声技術改善の取り組み。

2025-06-13T09:18:50+00:00 ― 1 分で読む

計算と言語言語モデルで音声認識の精度を向上させる

音声認識システムのエラーを修正するための言語モデルを使った研究。

2025-06-12T22:47:15+00:00 ― 1 分で読む

音声認識 に関する最新の記事

音声認識に関する最新の記事