台湾の普通話で自然な会話ができるAIモデルを作ってる。
Chih-Kai Yang, Yu-Kuan Fu, Chen-An Li
― 1 分で読む
最先端の科学をわかりやすく解説
台湾の普通話で自然な会話ができるAIモデルを作ってる。
Chih-Kai Yang, Yu-Kuan Fu, Chen-An Li
― 1 分で読む
Mambaはスピードと精度で音声認識を強化して、デバイスとのやり取りを変えてるんだ。
Yoshiki Masuyama, Koichi Miyazaki, Masato Murata
― 1 分で読む
新しい方法が周りの視覚情報を使って話の明瞭さを高める。
Xinyuan Qian, Jiaran Gao, Yaodan Zhang
― 1 分で読む
今日のメディア環境におけるディープフェイク技術の課題と影響を探る。
Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin
― 1 分で読む
研究によると、脳波がサイレントコミュニケーションに役立つことがわかった。
Soowon Kim, Ha-Na Jo, Eunyeong Ko
― 1 分で読む
研究は、脳の信号をいろんなタイプの言葉に翻訳しようとしてる。
Jung-Sun Lee, Ha-Na Jo, Seo-Hyun Lee
― 1 分で読む
新しいモデルが音声技術における偽の声の検出を改善してるよ。
Yang Xiao, Rohan Kumar Das
― 1 分で読む
このプロジェクトは、明確なコミュニケーションのためにバングラの方言を標準化することを目指してるんだ。
Md. Nazmus Sadat Samin, Jawad Ibn Ahad, Tanjila Ahmed Medha
― 1 分で読む
SAMOSは、自然さを高めるためにスピーチの質を測る新しい方法を提供してるよ。
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 1 分で読む
注ぐ飲み物の音の裏にある魅力的な科学を探ってみよう。
Piyush Bagad, Makarand Tapaswi, Cees G. M. Snoek
― 0 分で読む
新しいシステムは、音程とスペクトラムを使って歌声を評価するんだ。
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 1 分で読む
ディープラーニングが音楽のレコメンデーションをどう変えてるかを発見しよう。
Aditya Sridhar
― 1 分で読む
機械がスペクトrogram画像を使って音を分類する方法を学ぼう。
Satvik Dixit, Laurie M. Heller, Chris Donahue
― 1 分で読む
音声圧縮の革新的な方法と、それが没入型サウンドに与える影響を探ろう。
Toni Hirvonen, Mahmoud Namazi
― 1 分で読む
声の分析が若者のうつ病の初期兆候を見つける手助けになるかもしれないよ。
Klaus R. Scherer, Felix Burkhardt, Uwe D. Reichel
― 0 分で読む
新しいテストは、TTSの声の評価の公正さを改善することを目的としている。
Praveen Srinivasa Varadhan, Amogh Gulati, Ashwin Sankar
― 1 分で読む
研究はコンピュータが音楽の会話を理解できるようにすることに焦点を当ててる。
Daeyong Kwon, SeungHeon Doh, Juhan Nam
― 1 分で読む
テクノロジーが音波解析を通じて私たちの声をどう解釈するかを学ぼう。
Nirmal Joshua Kapu, Raghav Karan
― 1 分で読む
Tiny-Alignは、小さなデバイスでのパーソナルなやり取りを改善するためにボイスアシスタントを強化するよ。
Ruiyang Qin, Dancheng Liu, Gelei Xu
― 1 分で読む
FabuLight-ASDは音声、ビジュアル、体の動きのデータを組み合わせてスピーカーの検出を改善するよ。
Hugo Carneiro, Stefan Wermter
― 1 分で読む
新しいサウンドシステムは音の方向を特定して、騒がしい環境での検出を改善するんだ。
Erik Tegler, Magnus Oskarsson, Kalle Åström
― 1 分で読む
コミュニケーションがeスポーツのチームワークとパフォーマンスをどう向上させるか発見しよう。
Aymeric Vinot, Nicolas Perez
― 1 分で読む
HARPデータセットは、バーチャル環境での音の体験を変えるんだ。
Shivam Saini, Jürgen Peissig
― 1 分で読む
新しい技術が画像を没入型の音体験に変える方法を学ぼう。
Wei Guo, Heng Wang, Jianbo Ma
― 1 分で読む
新しい方法が最小限のデータで高い精度の音声認識を実現したよ。
Irfan Nafiz Shahan, Pulok Ahmed Auvi
― 1 分で読む
無限のオーディオエフェクトオプションで、音楽家のためのサウンド制作を革命的に変える。
Alec Wright, Alistair Carson, Lauri Juvela
― 1 分で読む
音楽分析におけるAIと人間の洞察をつなぐツール。
Prashanth Thattai Ravikumar
― 1 分で読む
音声トリックが言語モデルをどう混乱させるかを探る。
Wanqi Yang, Yanda Li, Meng Fang
― 1 分で読む
DiM-Gestorがリアルタイムでバーチャルキャラクターのジェスチャーをどう強化するかを発見しよう。
Fan Zhang, Siyuan Zhao, Naye Ji
― 1 分で読む
ディープフェイクの概要、そのリスク、そして新しいヒンディー語のデータセット。
Sukhandeep Kaur, Mubashir Buhari, Naman Khandelwal
― 1 分で読む
研究は、革新的な技術を通じて感情が私たちの記憶をどのように形成するかを明らかにしている。
Joonwoo Kwon, Heehwan Wang, Jinwoo Lee
― 1 分で読む
新しいASRシステムが医療の音声認識を向上させて、正確な患者ケアを実現するよ。
Sourav Banerjee, Ayushi Agarwal, Promila Ghosh
― 1 分で読む
音楽スタイル転送があなたの好きな曲に新しい命を吹き込む方法を発見しよう。
Sooyoung Kim, Joonwoo Kwon, Heehwan Wang
― 1 分で読む
新しい方法が動画から音声を生成して、吹き替えや言語学習を強化するよ。
Akshita Gupta, Tatiana Likhomanenko, Karren Dai Yang
― 1 分で読む
ASRモデルがスピーチのディープフェイクを効果的に特定する方法を探る。
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 1 分で読む
CAMSが音楽の作り方や体験をどう変えてるか学んでみよう。
Marco Pasini, Javier Nistal, Stefan Lattner
― 1 分で読む
新しい言語を効果的に学ぶための実用的なヒントガイド。
Shih-Heng Wang, Zih-Ching Chen, Jiatong Shi
― 1 分で読む
自動音声認識を使って、多言語環境でスピーカーを効率よく追跡する。
Thai-Binh Nguyen, Alexander Waibel
― 1 分で読む
新しい方法が機械の話し言葉の認識を改善してる。
Shih-heng Wang, Jiatong Shi, Chien-yu Huang
― 1 分で読む
失敗した音楽スタイル転送の世界を面白い音声録音を使って探ってるよ。
Chon In Leong, I-Ling Chung, Kin-Fong Chao
― 1 分で読む