コンピューターサイエンス - サウンド

RSS

サウンド ElasticAST: 音声分類の柔軟なアプローチ

ElasticASTは重要な詳細を失うことなく、可変長オーディオを効率的に処理できる。

2025-07-18T02:31:05+00:00 ― 1 分で読む

サウンド声のクローン：音楽権利の新たな挑戦

声のクローン技術が進化する中で、歌手の識別方法を分析してる。

2025-07-18T01:42:30+00:00 ― 1 分で読む

サウンド部分的にフェイクな音声を検出する新しい方法

新しいアプローチが、本物と偽物の音声クリップを混ぜたものの検出を改善する。

2025-07-17T17:36:40+00:00 ― 1 分で読む

音声・音声処理スピーチテクノロジーにおけるマンバの効率を評価する

マンバはスピーチタスクでトランスフォーマーに対して期待できる成果を見せてて、特に長い入力に対して効果的だね。

2025-07-17T13:33:45+00:00 ― 1 分で読む

サウンド SingFlexを使った歌声合成の進歩

SingFlexは、さまざまな歌声を効率的に作り出すための革新的なソリューションを提供してるよ。

2025-07-17T07:05:05+00:00 ― 1 分で読む

情報理論アイルランドのダンス音楽における複雑さの測定

圧縮手法を使ったアイルランド伝統舞踏曲の複雑さに関する研究。

2025-07-17T06:56:50+00:00 ― 1 分で読む

サウンド RefinPaint：音楽生成への新しいアプローチ

RefinPaintは、音楽制作を強化して、弱い部分をうまく特定して改善するよ。

2025-07-17T06:16:30+00:00 ― 1 分で読む

サウンドスピーカー認証の向上のためのWhisperの適応

新しいフレームワークが限られたデータでスピーカー認証のパフォーマンスを向上させる。

2025-07-17T00:36:25+00:00 ― 1 分で読む

サウンドギャップを埋める：AIとミュージシャンのハーモニー

音楽家とAIが解釈を通じてコラボする新しい方法を探ってる。

2025-07-16T15:42:00+00:00 ― 1 分で読む

音声・音声処理継続的学習で音声セキュリティを進化させる

CADEは、進化するスプーフィング脅威に対抗するために継続的学習技術を使って音声検出を強化してるよ。

2025-07-16T10:50:30+00:00 ― 1 分で読む

ロボット工学ロボティクスにおける物体位置特定のための音の利用

新しい方法でロボットが音を使って落ちた物を見つけるのを手助けするんだ。

2025-07-16T06:47:35+00:00 ― 1 分で読む

サウンド音声制御ドローンシステムの進展

新しい音声コマンドシステムで、手を使わずにドローンをコントロールできるようになったよ。

2025-07-16T05:42:18+00:00 ― 1 分で読む

サウンドギターアンプモデリングの進化

新しい技術がギターアンプやエフェクトのエミュレーションをより良くしてるよ。

2025-07-15T23:30:20+00:00 ― 0 分で読む

音声・音声処理知識蒸留を使ったコードスイッチングASRの改善

新しいフレームワークが限られたデータとリソースでASRのパフォーマンスを向上させる。

2025-07-15T22:41:45+00:00 ― 1 分で読む

サウンド拡散モデルを使った音声合成の進化

新しい方法が革新的なアテンション技術を使って音声生成の効率を向上させる。

2025-07-15T20:16:00+00:00 ― 0 分で読む

サウンド BandControlNet: 音楽制作の新しいアプローチ

BandControlNetでAIが音楽生成をどんどん変えてるのを発見しよう。

2025-07-15T19:27:25+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ディープフェイクを検出する新しい方法

新しいアプローチで音声と映像の分析を使ってディープフェイクの検出が改善されたよ。

2025-07-15T12:10:10+00:00 ― 1 分で読む

サウンド自動音声認識システムの進化

音声認識技術とその方法の進展を見てみよう。

2025-07-15T11:21:35+00:00 ― 1 分で読む

サウンド MMSD-Netで吃音検出を改善する

音声、映像、テキストデータを組み合わせて、吃音の検出を強化する新しい方法が登場したよ。

2025-07-15T07:18:40+00:00 ― 1 分で読む

サウンド 3D人間モデルのための革新的なサウンド生成

新しい方法でリアルな3D人間モデルの音作りが向上したよ。

2025-07-15T00:01:25+00:00 ― 1 分で読む

サウンドスピーチ分析で呼吸率を推定する

この研究は、高度なモデルを使って話し方から呼吸率を推定できることを明らかにしているよ。

2025-07-14T23:12:50+00:00 ― 1 分で読む

サウンド GraphMuse：音楽分析の新ツール

GraphMuseは、先進的な機械学習技術を使って、シンボリック音楽データの分析を簡素化するよ。

2025-07-14T19:58:30+00:00 ― 1 分で読む

音声・音声処理ポーランド語の音声認識を改善する

研究がポーランド語の音声認識システムを評価する新しい方法を提案している。

2025-07-14T16:44:10+00:00 ― 1 分で読む

音声・音声処理 MSceneSpeech: マンダリン音声合成の進展

新しいデータセットがマンダリンの機械音声を向上させて、自然な表現を目指してるよ。

2025-07-14T09:26:55+00:00 ― 1 分で読む

マルチメディア音声と視覚の統合による音源定位の進展

音声と視覚情報をうまく使って音源定位を改善する研究。

2025-07-14T06:12:35+00:00 ― 1 分で読む

機械学習言語分析を通じて認知健康を評価する

新しいフレームワークが話し言葉を分析して、言語を超えて軽度認知障害を特定する。

2025-07-14T05:24:00+00:00 ― 1 分で読む

サウンド AIと多様な音楽ジャンルの課題

マイナーな音楽スタイルに対するAIの影響を探る。

2025-07-14T02:58:15+00:00 ― 1 分で読む

計算と言語インドの言語のテキスト読み上げを改善する

インドでのOOV単語の発音を良くするためのTTSシステムを強化する方法。

2025-07-14T02:09:40+00:00 ― 1 分で読む

サウンド機械学習を使った補聴器技術の進歩

新しい機械学習モデルが補聴器ユーザーの音声の明瞭さを向上させる。

2025-07-13T23:43:55+00:00 ― 1 分で読む

サウンド低周波音声を使った社会的相互作用の研究

研究は、社会行動研究におけるプライバシー保護のために低周波音を探求している。

2025-07-13T21:18:10+00:00 ― 1 分で読む

音声・音声処理接続空間における音の伝播の理解

複数の部屋で音がどう振る舞うかを探って、そのテクノロジーへの影響を考えてる。

2025-07-13T20:29:35+00:00 ― 1 分で読む

音声・音声処理 AIツールが音楽編集プロセスを変革中

新しいAIツールが、革新的な技術と向上した精度で音楽編集を簡単にしてるよ。

2025-07-13T18:52:25+00:00 ― 1 分で読む

計算と言語スピーチ翻訳の新しいアプローチ：プリセット音声マッチング

プリセット音声マッチングは、スピーチ翻訳を改善しつつ、プライバシーを守り、リスクを減らすんだ。

2025-07-13T18:03:50+00:00 ― 1 分で読む

サウンド作曲家のアシスタント 2: 音楽家のための新しいツール

新しいシステムは、ミュージシャンがより大きなコントロールと精度で音楽を作れるように手助けするよ。

2025-07-13T14:00:55+00:00 ― 1 分で読む

サウンド AIの音楽の独創性への影響を評価する

AIが作った音楽の再現性を評価する新しいツール。

2025-07-13T12:23:45+00:00 ― 1 分で読む

サウンドオープンオーディオ生成：新しいモデル

公開データだけを使った新しいテキストからオーディオへのモデル。

2025-07-13T11:35:10+00:00 ― 1 分で読む

計算と言語 Rasa: インド言語音声合成の画期的な技術

Rasaデータセットは、インドの言語に対して中立的で表現力豊かな音声を使ったテキスト読み上げを進化させる。

2025-07-13T05:55:05+00:00 ― 1 分で読む

サウンド音声感情認識技術の進展

新しい方法で、機械が人間の感情を話し声からもっと理解できるようになったよ。

2025-07-12T18:34:55+00:00 ― 1 分で読む

サウンドアーティストのためのAIツールを使いやすくする

AIツールを簡単にすることで、アーティストが自分のクリエイティブな表現を広げる手助けになるよ。

2025-07-12T17:46:20+00:00 ― 1 分で読む

サウンド MusiConGen: テキストから音楽への技術を進化させる

MusiConGenはテキストから音楽を生成する際のユーザーコントロールを強化するよ。

2025-07-12T16:57:45+00:00 ― 1 分で読む