コンピューターサイエンス - サウンド

RSS

音声・音声処理 SSRLで音声認識を進化させる

新しい方法が、少ないラベルとリソースで音声認識を改善する。

2025-09-01T00:15:30+00:00 ― 1 分で読む

サウンドテキストからオーディオへのグラウンディング技術の進展

新しい方法でテキストの説明を音のイベントにリンクさせるのがもっと簡単になったよ。

2025-08-31T16:09:40+00:00 ― 1 分で読む

音声・音声処理移動ロボットにおける音の方向検出

革新的な方法が、ロボットが動いている間の音の方向処理を改善する。

2025-08-31T14:32:30+00:00 ― 0 分で読む

音声・音声処理ビームフォーミング技術の進展

実数値ビームフォーミングとそれがマイクロフォンアレイに与えるメリットを学ぼう。

2025-08-31T12:06:45+00:00 ― 1 分で読む

サウンド AIによる音楽生成の新しいモデル

MusicAOGは、革新的なグラフ表現を通じて音楽の制作と理解を簡単にするよ。

2025-08-31T08:52:25+00:00 ― 1 分で読む

音声・音声処理球面アレイを使った効果的なMIMOシステムの設計

音響研究における球面マイクロフォンとスピーカーアレイを組み合わせる新しいフレームワーク。

2025-08-31T07:15:15+00:00 ― 1 分で読む

音声・音声処理ヒューマノイドロボットのための効果的な聴覚システムの設計

マイクロフォンアレイ設計を通じて、人型ロボットの音検出を改善するための新しいフレームワーク。

2025-08-31T06:26:40+00:00 ― 1 分で読む

音声・音声処理 MIMOシステムを使った部屋の音響改善

MIMOシステムがいろんな環境で音の分析をどう良くするか発見しよう。

2025-08-31T02:23:45+00:00 ― 1 分で読む

音声・音声処理部屋の音響研究の進展

新しい技術が音の方向推定をいろんな音響環境で改善してるよ。

2025-08-31T01:35:10+00:00 ― 1 分で読む

音声・音声処理クリアなリスニング体験のための音のコントロール

研究によると、部屋の音の振る舞いを調整して明瞭さを向上させる方法がわかったよ。

2025-08-31T00:46:35+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 FunnyNet-Wを使った動画のユーモア検出

新しいモデルがビデオの面白い瞬間を視覚、音声、テキストデータを使って特定するんだ。

2025-08-30T23:09:25+00:00 ― 1 分で読む

音声・音声処理技術のための誘電エラスチマーの進展

電気エラスマーは電気エネルギーを機械的動きに変換して、いろんな用途があるんだ。

2025-08-30T20:43:40+00:00 ― 1 分で読む

計算と言語 ASR技術を使って認知症診断を助ける

誤りのあるASRトランスクリプトは、アルツハイマーをもっと正確に特定するのに役立つ。

2025-08-30T16:40:45+00:00 ― 1 分で読む

計算と言語 ELLA-Vを紹介するよ：音声合成の新しい章だ！

ELLA-Vはテキスト読み上げの品質とコントロールを向上させて、以前のモデルを超えたよ。

2025-08-30T01:17:40+00:00 ― 1 分で読む

定量的手法新しい方法が野生動物の音響モニタリングを強化するよ。

新しいアプローチで動物の鳴き声検出精度が、恣意的な閾値なしで向上したよ。

2025-08-29T23:46:39+00:00 ― 1 分で読む

計算と言語マルチモーダルデータを使った音声分類の進展

新しいモデルは、音声とテキストを統合して、より良いスピーチ分類を実現してるよ。

2025-08-29T18:49:00+00:00 ― 1 分で読む

サウンド NOTSOFAR-1チャレンジ：ミーティング文字起こし技術の進化

大きな部屋での会議用にトランスクリプション技術を改善する新しい取り組み。

2025-08-29T16:23:15+00:00 ― 1 分で読む

計算と言語音声認識のエラー修正の進展

新しい方法が、大規模言語モデルを使った騒がしい音声認識の精度を向上させるよ。

2025-08-29T01:48:45+00:00 ― 1 分で読む

サウンドより良い農業のための産卵鶏の鳴き声の理解

鶏の鳴き声を分析することで、健康や農場の生産性が向上するんだ。

2025-08-29T00:11:35+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションサウンドアンブレンディング：ミックスドリアリティのための新しいツール

混合現実で視覚障害者が音を認識する手助けをする方法。

2025-08-28T20:57:15+00:00 ― 1 分で読む

音声・音声処理リソースの少ない言語のスピーチテクノロジーの課題に取り組む

この記事では、書き起こしデータが限られている言語の音声アプリケーションの解決策について話しているよ。

2025-08-28T18:31:30+00:00 ― 1 分で読む

機械学習投影ベイジアンネットワークを使った音分類の進展

研究者たちは、音声分類を改善するために生成的と識別的な手法を組み合わせている。

2025-08-28T16:05:45+00:00 ― 1 分で読む

暗号とセキュリティスピーカー認証を偽造攻撃から守る強化

新しいモデルが音声認識のセキュリティを向上させ、音声の偽造に対抗できるようになった。

2025-08-28T15:17:10+00:00 ― 1 分で読む

機械学習 GAAMを使ったアテンションメカニズムの強化

AIのパフォーマンス向上のためのガウス適応アテンションについて。

2025-08-28T14:28:35+00:00 ― 1 分で読む

音声・音声処理ディープラーニングと言語リズム分析

研究によると、深層学習は言語のリズムを理解するのに役立つんだって。

2025-08-28T12:51:25+00:00 ― 1 分で読む

音声・音声処理 CoAVTを使ったマルチモーダル処理の進展

CoAVTは、音声、映像、テキストデータを統合して、理解を深めるんだ。

2025-08-28T12:02:50+00:00 ― 1 分で読む

音声・音声処理 E-SHARC法によるスピーカーダイアライゼーションの進展

E-SHARCは、いろんな音声環境でのスピーカー識別を改善するよ。

2025-08-28T06:22:45+00:00 ― 1 分で読む

サウンド MoodLoopGP: 繰り返せる音楽で感情を作る

新しいシステムが、幸せや悲しみを表現する音楽を作るんだ。

2025-08-28T04:45:35+00:00 ― 1 分で読む

サウンド生成音楽モデルにおける影響を探る

生成モデルにおける音楽の類似性を理解するためのガイド。

2025-08-27T22:16:55+00:00 ― 1 分で読む

音声・音声処理音の再生と評価の技術

音合成とその評価に関する研究、制御された環境での。

2025-08-27T16:36:50+00:00 ― 1 分で読む

音声・音声処理音源定位技術の進展

新しい方法がマイクロフォンアレイを使って動く音源を探す精度を高める。

2025-08-27T01:13:45+00:00 ― 1 分で読む

音声・音声処理 PAMを使った音質評価の新しいアプローチ

PAMは、参照録音なしで音質を測定する新しい方法を提供してるよ。

2025-08-26T21:10:50+00:00 ― 1 分で読む

サウンドオーディオフラミンゴ：音理解の新モデル

オーディオフラミンゴは、聞くこと、会話すること、新しいオーディオタスクに適応するのが得意だよ。

2025-08-26T16:19:20+00:00 ― 1 分で読む

音声・音声処理機械の空間音響推論を進める

新しいモデルが機械の空間音声の理解を向上させる。

2025-08-26T15:30:45+00:00 ― 1 分で読む

計算と言語リアルタイム音声認識システムの強化

新しいモデルがリアルタイムアプリでの音声からテキストへの効率を改善した。

2025-08-26T11:27:50+00:00 ― 1 分で読む

計算と言語言語関係における音の役割を再評価する

この研究は、言語系統樹を再構築する際の音と単語を比較してるんだ。

2025-08-26T03:22:00+00:00 ― 1 分で読む

機械学習 AI音楽生成の進展

新しいモデルがユーザーのフィードバックを使って音楽制作を改善したよ。

2025-08-25T21:41:55+00:00 ― 1 分で読む

音声・音声処理リボーン：教師なしASRの新時代

Rebornは、ラベル付きデータなしで自動音声認識の革新的なソリューションを提供してるよ。

2025-08-25T19:16:10+00:00 ― 1 分で読む

音声・音声処理音を変える：聞いて、チャットして、編集するツール

新しいツールがあって、ユーザーは簡単なテキスト指示で音を簡単に変更できるよ。

2025-08-25T17:39:00+00:00 ― 1 分で読む

計算と言語言語技術の進歩

新しいモデルは、話し言葉と書き言葉を組み合わせて、コミュニケーションを改善するんだ。

2025-08-25T03:53:05+00:00 ― 1 分で読む