この記事では、アクセント付きのスピーチの認識を向上させる方法について話してるよ。
Francesco Nespoli, Daniel Barreda, Patrick A. Naylor
― 1 分で読む
最先端の科学をわかりやすく解説
この記事では、アクセント付きのスピーチの認識を向上させる方法について話してるよ。
Francesco Nespoli, Daniel Barreda, Patrick A. Naylor
― 1 分で読む
この研究はリソースが少ない言語の音声モデルの課題について扱ってるよ。
Potsawee Manakul, Guangzhi Sun, Warit Sirichotedumrong
― 1 分で読む
インドの言語でのスピーチ合成をインターパウザルユニットを使って強化する。
Anusha Prakash, Hema A Murthy
― 1 分で読む
CADA-GANは、いろんな録音環境でASRシステムの性能を向上させるよ。
Chien-Chun Wang, Li-Wei Chen, Cheng-Kang Chou
― 1 分で読む
Llama-AVSRは音声と視覚の入力を組み合わせて、スピーチ認識の精度を向上させるんだ。
Umberto Cappellazzo, Minsu Kim, Honglie Chen
― 1 分で読む
新しい方法が仮想シャドウイングを使って、語学学習者の発音フィードバックを向上させるんだ。
Haopeng Geng, Daisuke Saito, Nobuaki Minematsu
― 1 分で読む
新しいASRメソッドが、技術が子供の話し方をもっと理解できるようにしてるんだ。
Zhonghao Shi, Harshvardhan Srivastava, Xuan Shi
― 1 分で読む
YOSSは音を使って画像内の物体認識を向上させる。
Wenhao Yang, Jianguo Wei, Wenhuan Lu
― 1 分で読む
リソースが限られた言語のための音声とテキストデータセットを開発するプロジェクト。
Nikola Ljubešić, Peter Rupnik, Danijel Koržinek
― 1 分で読む
新しいフレームワークが音声認識を強化して、さまざまなスピーチタスクに適応するよ。
Junyi Peng, Ladislav Mošner, Lin Zhang
― 1 分で読む
新しい方法が、テキストのないリソースの少ない言語の音声認識を改善してるよ。
Krithiga Ramadass, Abrit Pal Singh, Srihari J
― 1 分で読む
新しい方法が音声認識システムの精度を向上させるために音声学的理解を活用してるよ。
Leonid Velikovich, Christopher Li, Diamantino Caseiro
― 1 分で読む
新しい音響特徴が騒がしい環境でのASRシステムのパフォーマンスを向上させる。
Muhammad A. Shah, Bhiksha Raj
― 1 分で読む
新しいモデルが、精度を落とさずに音声の文字起こしをより速く実現したよ。
Yael Segal-Feldman, Aviv Shamsian, Aviv Navon
― 1 分で読む
マトリョーシカエンベディングが話者認識の効率と柔軟性をどう向上させるかを発見しよう。
Shuai Wang, Pengcheng Zhu, Haizhou Li
― 1 分で読む
新しいモデルのVoiceGuiderは、さまざまな話者のためのTTSを改善したよ。
Jiheum Yeom, Heeseung Kim, Jooyoung Choi
― 1 分で読む
新しい方法が長い録音の音声認識を改善する。
Hao Yen, Shaoshi Ling, Guoli Ye
― 1 分で読む
新しいスピーチ言語モデルの方法は、大量のデータの必要性を減らす。
Ke-Han Lu, Zhehuai Chen, Szu-Wei Fu
― 1 分で読む
新しい手法が音声録音におけるスピーカーの識別をどのように変えているか。
Petr Pálka, Federico Landini, Dominik Klement
― 1 分で読む
TSEが混雑した環境でテキストキューを使って音声認識を改善する方法を学ぼう。
Ziyang Jiang, Xinyuan Qian, Jiahe Lei
― 1 分で読む
音声アシスタントは高齢者の記憶の問題の初期兆候を特定するのに役立つよ。
Nana Lin, Youxiang Zhu, Xiaohui Liang
― 1 分で読む
Mambaはスピードと精度で音声認識を強化して、デバイスとのやり取りを変えてるんだ。
Yoshiki Masuyama, Koichi Miyazaki, Masato Murata
― 1 分で読む
新しい方法が周りの視覚情報を使って話の明瞭さを高める。
Xinyuan Qian, Jiaran Gao, Yaodan Zhang
― 1 分で読む
SAMOSは、自然さを高めるためにスピーチの質を測る新しい方法を提供してるよ。
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 1 分で読む
Tiny-Alignは、小さなデバイスでのパーソナルなやり取りを改善するためにボイスアシスタントを強化するよ。
Ruiyang Qin, Dancheng Liu, Gelei Xu
― 1 分で読む
VQalAttentを紹介するよ、リアルな機械音声を生成するためのシンプルなモデルだ。
Armani Rodriguez, Silvija Kokalj-Filipovic
― 1 分で読む
新しいASRシステムが医療の音声認識を向上させて、正確な患者ケアを実現するよ。
Sourav Banerjee, Ayushi Agarwal, Promila Ghosh
― 1 分で読む
ASRモデルがスピーチのディープフェイクを効果的に特定する方法を探る。
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 1 分で読む
自動音声認識を使って、多言語環境でスピーカーを効率よく追跡する。
Thai-Binh Nguyen, Alexander Waibel
― 1 分で読む
音声障害をよりよく理解するための機械転写の改善。
Jiachen Lian, Xuanru Zhou, Zoe Ezzes
― 1 分で読む
新しいモデルが中国語の音声認識精度を大幅に向上させたよ。
Junhong Liang
― 1 分で読む
Noroは音声変換を強化して、うるさい環境でも効果的だよ。
Haorui He, Yuchen Song, Yuancheng Wang
― 1 分で読む
感情を理解した人間みたいな会話ができる新しいチャットボット。
Aohan Zeng, Zhengxiao Du, Mingdao Liu
― 1 分で読む
スタイルに左右されない評価が自動音声認識システムをどう改善するかを見てみよう。
Quinten McNamara, Miguel Ángel del Río Fernández, Nishchal Bhandari
― 1 分で読む
適応型ドロップアウトが音声認識システムの効率をどう改善するかを学ぼう。
Yotaro Kubo, Xingyu Cai, Michiel Bacchiani
― 1 分で読む
研究がAIの子供とのコミュニケーション能力を介護者のようにテストしてるよ。
Jing Liu, Abdellah Fourtassi
― 1 分で読む
音声をテキストに変換するツールが、話された数学を簡単にLaTeXに変換してくれるよ。
Evangelia Gkritzali, Panagiotis Kaliosis, Sofia Galanaki
― 1 分で読む
効率と自然な声を改善して、テキスト読み上げを革命的に変える。
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 1 分で読む
音声認識技術は、特にうるさい環境での数字認識を向上させるよ。
Ali Nasr-Esfahani, Mehdi Bekrani, Roozbeh Rajabi
― 1 分で読む
日本語のための多言語ASR性能をターゲットを絞ったファインチューニングで向上させる。
Mark Bajo, Haruka Fukukawa, Ryuji Morita
― 1 分で読む