GigaSpeech 2は、音声認識を改善するためのリソースの少ない言語向けの膨大なデータセットを提供してるよ。
― 1 分で読む
最先端の科学をわかりやすく解説
GigaSpeech 2は、音声認識を改善するためのリソースの少ない言語向けの膨大なデータセットを提供してるよ。
― 1 分で読む
子供たちの日常を捉えたユニークなデータセットが、機械学習や人間の学習の理解を深めるために作られてるんだ。
― 1 分で読む
生成AIがコンテンツの作り方をどう変えてるかを発見しよう。
― 1 分で読む
新しい方法が音声認識システムの精度と効率を向上させる。
― 1 分で読む
新しいモデルは、音声認識とモールス信号を使って、障害のある人たちのコミュニケーションを強化するんだ。
― 1 分で読む
音声駆動型モデルがテクノロジーとの音声インタラクションを変革中。
― 1 分で読む
新しいデータセットは、身体伝導センサーを使って音声キャプチャを改善することを目的としてるよ。
― 1 分で読む
研究がポーランド語の音声認識システムを評価する新しい方法を提案している。
― 1 分で読む
研究者たちがEEGを使って話す能力を改善する方法を進化させて、話すのに困難がある人たちを助けてるんだ。
― 1 分で読む
この研究は、オーラルヒストリーのために異なる言語を使った音声認識システムを評価してる。
― 1 分で読む
OpenOmniは、会話エージェントを作成・テストするための柔軟なツールを作ってるよ。
― 1 分で読む
研究は、言語を超えた話し言葉の会話のより良い要約に焦点を当てている。
― 1 分で読む
NESTは、自己教師あり音声タスクに対してより速く、効率的なアプローチを提供してるよ。
― 1 分で読む
研究は、より正確な音声認識のためのエラー予測に焦点を当てている。
― 0 分で読む
研究が多様なアクセントを持つヒンディー語の音声認識を改善する。
― 1 分で読む
新しい方法が複数の言語での音声認識精度を向上させる。
― 1 分で読む
研究者たちは、騒がしい環境での音声認識を改善するためにLibriheavyMixを作り出した。
― 1 分で読む
この研究は、Mambaのスピーチタスクにおけるパフォーマンスを分析していて、音の再構築と認識に重点を置いてるんだ。
― 1 分で読む
研究者たちが音声認識と分析技術を向上させるためのデータセットを開発した。
― 1 分で読む
資源が乏しいファエター語のための音声技術改善の取り組み。
― 1 分で読む
音声認識システムのエラーを修正するための言語モデルを使った研究。
― 1 分で読む
データプライバシーを守りながら音声認識を改善する新しい方法。
― 1 分で読む
研究によると、警察の無線通信の音声認識には難しさがあるみたい。
― 1 分で読む
WeHelpは車椅子ユーザーの日常活動をサポートするロボット支援を提供してるよ。
― 1 分で読む
この研究はリソースが少ない言語の音声モデルの課題について扱ってるよ。
― 1 分で読む
EVAは音声と視覚の信号を組み合わせて、スピーチ認識の精度を向上させるんだ。
― 1 分で読む
研究は、認識と翻訳を改善するために、スピーチとランゲージモデルの関係を評価している。
― 1 分で読む
キーワードリストと言語モデルを組み合わせて自動音声認識を強化する方法。
― 1 分で読む
少ないラベル付きリソースでスピーチモデルを効果的にトレーニングする方法を学ぼう。
― 1 分で読む
EMOVAは感情表現を通じて人間とコンピュータのインタラクションを強化する。
― 1 分で読む
NYCUKAみたいなAIツールは、学生のメンタルヘルスサポートを効果的に強化することを目指してるよ。
― 1 分で読む
最近の調査で、圧力センサーが盗聴に使えることがわかったよ。
― 1 分で読む
この研究は、音声認識において音声、動画、テキストがどうやって一緒に機能するかを分析している。
― 0 分で読む
新しい方法が、言語障害のある人のためのコミュニケーションツールを改善してるよ。
― 1 分で読む
SLAM-ASRの強み、弱み、そして音声認識における未来を調べる。
― 1 分で読む
プロジェクトは、タミルのリソースを使ってマラサール語の音声認識を改善するよ。
― 1 分で読む
NeKoは、話し言葉、翻訳、テキストのエラーを修正することで機械間のコミュニケーションを強化するよ。
― 1 分で読む
台湾の普通話で自然な会話ができるAIモデルを作ってる。
― 1 分で読む
Mambaはスピードと精度で音声認識を強化して、デバイスとのやり取りを変えてるんだ。
― 1 分で読む
テクノロジーが音波解析を通じて私たちの声をどう解釈するかを学ぼう。
― 1 分で読む