新しい方法が、少ないラベルとリソースで音声認識を改善する。
― 1 分で読む
最先端の科学をわかりやすく解説
新しい方法が、少ないラベルとリソースで音声認識を改善する。
― 1 分で読む
新しい方法でテキストの説明を音のイベントにリンクさせるのがもっと簡単になったよ。
― 1 分で読む
革新的な方法が、ロボットが動いている間の音の方向処理を改善する。
― 0 分で読む
実数値ビームフォーミングとそれがマイクロフォンアレイに与えるメリットを学ぼう。
― 1 分で読む
MusicAOGは、革新的なグラフ表現を通じて音楽の制作と理解を簡単にするよ。
― 1 分で読む
音響研究における球面マイクロフォンとスピーカーアレイを組み合わせる新しいフレームワーク。
― 1 分で読む
マイクロフォンアレイ設計を通じて、人型ロボットの音検出を改善するための新しいフレームワーク。
― 1 分で読む
MIMOシステムがいろんな環境で音の分析をどう良くするか発見しよう。
― 1 分で読む
新しい技術が音の方向推定をいろんな音響環境で改善してるよ。
― 1 分で読む
研究によると、部屋の音の振る舞いを調整して明瞭さを向上させる方法がわかったよ。
― 1 分で読む
新しいモデルがビデオの面白い瞬間を視覚、音声、テキストデータを使って特定するんだ。
― 1 分で読む
電気エラスマーは電気エネルギーを機械的動きに変換して、いろんな用途があるんだ。
― 1 分で読む
誤りのあるASRトランスクリプトは、アルツハイマーをもっと正確に特定するのに役立つ。
― 1 分で読む
ELLA-Vはテキスト読み上げの品質とコントロールを向上させて、以前のモデルを超えたよ。
― 1 分で読む
新しいアプローチで動物の鳴き声検出精度が、恣意的な閾値なしで向上したよ。
― 1 分で読む
新しいモデルは、音声とテキストを統合して、より良いスピーチ分類を実現してるよ。
― 1 分で読む
大きな部屋での会議用にトランスクリプション技術を改善する新しい取り組み。
― 1 分で読む
新しい方法が、大規模言語モデルを使った騒がしい音声認識の精度を向上させるよ。
― 1 分で読む
鶏の鳴き声を分析することで、健康や農場の生産性が向上するんだ。
― 1 分で読む
混合現実で視覚障害者が音を認識する手助けをする方法。
― 1 分で読む
この記事では、書き起こしデータが限られている言語の音声アプリケーションの解決策について話しているよ。
― 1 分で読む
研究者たちは、音声分類を改善するために生成的と識別的な手法を組み合わせている。
― 1 分で読む
新しいモデルが音声認識のセキュリティを向上させ、音声の偽造に対抗できるようになった。
― 1 分で読む
AIのパフォーマンス向上のためのガウス適応アテンションについて。
― 1 分で読む
研究によると、深層学習は言語のリズムを理解するのに役立つんだって。
― 1 分で読む
CoAVTは、音声、映像、テキストデータを統合して、理解を深めるんだ。
― 1 分で読む
E-SHARCは、いろんな音声環境でのスピーカー識別を改善するよ。
― 1 分で読む
新しいシステムが、幸せや悲しみを表現する音楽を作るんだ。
― 1 分で読む
生成モデルにおける音楽の類似性を理解するためのガイド。
― 1 分で読む
音合成とその評価に関する研究、制御された環境での。
― 1 分で読む
新しい方法がマイクロフォンアレイを使って動く音源を探す精度を高める。
― 1 分で読む
PAMは、参照録音なしで音質を測定する新しい方法を提供してるよ。
― 1 分で読む
オーディオフラミンゴは、聞くこと、会話すること、新しいオーディオタスクに適応するのが得意だよ。
― 1 分で読む
新しいモデルが機械の空間音声の理解を向上させる。
― 1 分で読む
新しいモデルがリアルタイムアプリでの音声からテキストへの効率を改善した。
― 1 分で読む
この研究は、言語系統樹を再構築する際の音と単語を比較してるんだ。
― 1 分で読む
新しいモデルがユーザーのフィードバックを使って音楽制作を改善したよ。
― 1 分で読む
Rebornは、ラベル付きデータなしで自動音声認識の革新的なソリューションを提供してるよ。
― 1 分で読む
新しいツールがあって、ユーザーは簡単なテキスト指示で音を簡単に変更できるよ。
― 1 分で読む
新しいモデルは、話し言葉と書き言葉を組み合わせて、コミュニケーションを改善するんだ。
― 1 分で読む