言語モデルを使った新しい手法が、バックグラウンドノイズの中での音の検出を強化してるよ。
Han Yin, Yang Xiao, Jisheng Bai
― 1 分で読む
最先端の科学をわかりやすく解説
言語モデルを使った新しい手法が、バックグラウンドノイズの中での音の検出を強化してるよ。
Han Yin, Yang Xiao, Jisheng Bai
― 1 分で読む
Fish-Speechは、もっと自然なコミュニケーション体験のために声の技術を向上させるよ。
Shijia Liao, Yuxuan Wang, Tianyu Li
― 1 分で読む
EmoSphere++は、機械が人間みたいに感情を表現できるようにして、やり取りを良くするんだ。
Deok-Hyeon Cho, Hyung-Seok Oh, Seung-Bin Kim
― 1 分で読む
U-COTANSは深層学習技術を使って水中境界の検出を改善する。
Toros Arikan, Luca M. Chackalackal, Fatima Ahsan
― 1 分で読む
PIASTは研究者のためにユニークなピアノ音楽のコレクションを提供してるよ。
Hayeon Bang, Eunjin Choi, Megan Finch
― 1 分で読む
機械は3D空間で音と映像をつなげる方法を学ぶ。
Artem Sokolov, Swapnil Bhosale, Xiatian Zhu
― 1 分で読む
新しい手法が音声録音におけるスピーカーの識別をどのように変えているか。
Petr Pálka, Federico Landini, Dominik Klement
― 1 分で読む
研究者たちは、話しているときの舌の動きを可視化するためにテクノロジーを使っているんだ。
Sofiane Azzouz, Pierre-André Vuissoz, Yves Laprie
― 1 分で読む
Align-SLMがコンピュータ音声生成をどう変えてるか探ってみて。
Guan-Ting Lin, Prashanth Gurunath Shivakumar, Aditya Gourav
― 1 分で読む
TSEが混雑した環境でテキストキューを使って音声認識を改善する方法を学ぼう。
Ziyang Jiang, Xinyuan Qian, Jiahe Lei
― 1 分で読む
新しいシステムが叫び声を検知して、建設現場の作業員の安全を向上させるんだって。
Bikalpa Gautam, Anmol Guragain, Sarthak Giri
― 1 分で読む
高度なモデルを使って、スピーチの感情認識の新しい方法を探ってる。
Pourya Jafarzadeh, Amir Mohammad Rostami, Padideh Choobdar
― 1 分で読む
新しいアプローチでバックグラウンドノイズを考慮してスピーチ品質評価が向上したよ。
Subrina Sultana, Donald S. Williamson
― 1 分で読む
音声サンプルを合成して音楽クリエイターが簡単に革新できる新しいシステム。
Christopher Tralie, Ben Cantil
― 1 分で読む
ダイナミックレンジ圧縮が音の体験をどう良くするかを見てみよう。
Haoran Sun, Dominique Fourer, Hichem Maaref
― 1 分で読む
音声アシスタントは高齢者の記憶の問題の初期兆候を特定するのに役立つよ。
Nana Lin, Youxiang Zhu, Xiaohui Liang
― 1 分で読む
システムはテーブルトークRPGの物語に基づいてリアルタイムで音楽を作るんだ。
Felipe Marra, Lucas N. Ferreira
― 1 分で読む
SLAM-ASRの強み、弱み、そして音声認識における未来を調べる。
Shashi Kumar, Iuliia Thorbecke, Sergio Burdisso
― 1 分で読む
音場画像を明確にし、可視化する新しい方法。
Risako Tanigawa, Kenji Ishikawa, Noboru Harada
― 1 分で読む
プロジェクトは、タミルのリソースを使ってマラサール語の音声認識を改善するよ。
Leena G Pillai, Kavya Manohar, Basil K Raju
― 1 分で読む
研究者たちは、統合失調症のメンタルヘルス評価を改善するためにスピーチを探求している。
Gowtham Premananth, Carol Espy-Wilson
― 0 分で読む
ミュージシャンがどんだけ科学モデルとタイミングを合わせるか学ぼう。
Hugo T. Carvalho, Min S. Li, Massimiliano di Luca
― 0 分で読む
NeKoは、話し言葉、翻訳、テキストのエラーを修正することで機械間のコミュニケーションを強化するよ。
Yen-Ting Lin, Chao-Han Huck Yang, Zhehuai Chen
― 1 分で読む
音が音響ボリュームレンダリングを通じてバーチャル体験をどう豊かにするか発見しよう。
Zitong Lan, Chenhao Zheng, Zhiwei Zheng
― 1 分で読む
この研究では、音の分析を使ってマシンの故障を効果的に特定してるよ。
Tito Spadini, Kenji Nose-Filho, Ricardo Suyama
― 1 分で読む
Debattsは、ユーザーがディベートのための効果的な反論を作るのを手助けするよ。
Yiqiao Huang, Yuancheng Wang, Jiaqi Li
― 1 分で読む
新しいモデルが音の特定と位置づけを効果的に改善したよ。
Jinbo Hu, Yin Cao, Ming Wu
― 1 分で読む
AuscultaBaseは、さまざまな体音データを使って健康状態の診断精度を高めるよ。
Pingjie Wang, Zihan Zhao, Liudan Zhao
― 1 分で読む
新しいデータセットが、友達のような会話を通じて音楽を見つけるのを手伝ってくれるよ。
SeungHeon Doh, Keunwoo Choi, Daeyong Kwon
― 1 分で読む
音声録音と楽譜を組み合わせて、練習をより良くする。
Irmak Bukey, Michael Feffer, Chris Donahue
― 0 分で読む
AEROMambaは、低品質の音をリッチで高音質なサウンドに変えてくれるよ。
Wallace Abreu, Luiz Wagner Pereira Biscainho
― 1 分で読む
革新的な音声言語モデルが動物の音や行動の研究を助けてる。
David Robinson, Marius Miron, Masato Hagiwara
― 1 分で読む
台湾の普通話で自然な会話ができるAIモデルを作ってる。
Chih-Kai Yang, Yu-Kuan Fu, Chen-An Li
― 1 分で読む
Mambaはスピードと精度で音声認識を強化して、デバイスとのやり取りを変えてるんだ。
Yoshiki Masuyama, Koichi Miyazaki, Masato Murata
― 1 分で読む
新しい方法が周りの視覚情報を使って話の明瞭さを高める。
Xinyuan Qian, Jiaran Gao, Yaodan Zhang
― 1 分で読む
ダイナミックな環境での音の動きについての見方。
Kathleen MacWilliam, Thomas Dietzen, Randall Ali
― 1 分で読む
研究によると、脳波がサイレントコミュニケーションに役立つことがわかった。
Soowon Kim, Ha-Na Jo, Eunyeong Ko
― 1 分で読む
研究は、脳の信号をいろんなタイプの言葉に翻訳しようとしてる。
Jung-Sun Lee, Ha-Na Jo, Seo-Hyun Lee
― 1 分で読む
ゲームやバーチャルリアルで、幾何学と周波数が音をどう形作るかを発見しよう。
Vincent Martin, Isaac Engel, Lorenzo Picinali
― 0 分で読む
新しいモデルが音声技術における偽の声の検出を改善してるよ。
Yang Xiao, Rohan Kumar Das
― 1 分で読む