新しいシステムが視覚障害者が短い動画をもっと理解できるように手助けしてるよ。
― 1 分で読む
最先端の科学をわかりやすく解説
新しいシステムが視覚障害者が短い動画をもっと理解できるように手助けしてるよ。
― 1 分で読む
革新的なアプローチが、教育へのアクセスを恵まれないコミュニティに向上させてるよ。
― 1 分で読む
新しい技術がASRシステムを強化して、長いスピーチの認識がもっと良くなるよ。
― 1 分で読む
テキストの簡略化は、いろんな読者が情報にアクセスしやすくするのに役立つよ。
― 0 分で読む
色覚障害のある人々が科学的画像にアクセスできるようにするための研究。
― 1 分で読む
このプロジェクトはリアルタイムの音声翻訳と自動字幕システムを強化するんだ。
― 1 分で読む
MAIDRは、視覚障害者が音、触覚、テキストを通じてデータビジュアライゼーションにアクセスできるように手助けします。
― 1 分で読む
自動音声キャプションの進歩とそのアクセシビリティへの影響を探る。
― 1 分で読む
Chart4Blindは、複雑なチャートを視覚障害者がアクセスできる形式に変換するよ。
― 1 分で読む
AVQAテクノロジーがどうやって動画と音声を使って質問に答えるのかを見てみよう。
― 1 分で読む
研究によると、BLVユーザーは動画アクセスの好みがあることがわかった。
― 1 分で読む
混合現実で視覚障害者が音を認識する手助けをする方法。
― 1 分で読む
新しいモデルがリアルタイムアプリでの音声からテキストへの効率を改善した。
― 1 分で読む
私たちのモデルは、視覚障害者のユーザーのために使いやすさを向上させるヒントテキストを生成します。
― 1 分で読む
新しい方法で音声キャプションのアクセシビリティと正確性が向上してるよ。
― 1 分で読む
RASSARアプリは先進技術を使って家の安全性とアクセシビリティを向上させるよ。
― 1 分で読む
新しい方法が聴覚障害者のコミュニケーションを改善することを目指してるよ。
― 1 分で読む
カンナダ語とテルグ語の音声認識精度を向上させる方法。
― 1 分で読む
画像に対してより情報豊かなキャプションを生成する新しいアプローチ。
― 1 分で読む
RALL-Eはテキストから音声への合成を強化して、もっとクリアで自然な発話を実現するよ。
― 1 分で読む
新しい方法で手話の明瞭さと表現力が向上したよ。
― 1 分で読む
画像のテキストレイアウト分析を改善する新しいアプローチを紹介するよ。
― 1 分で読む
UIエージェントを強化することで、より良いユーザー体験が作れるって学ぼう。
― 1 分で読む
新しい方法が直接字幕を作成して、さまざまな視聴者のアクセシビリティを向上させる。
― 1 分で読む
コミュニケーションで感情をもっと上手く表現するために、テクノロジーがどう役立つかを考える。
― 1 分で読む
新しい方法でAIがテキストと画像をつなげて、もっといい結果を出すようになったよ。
― 1 分で読む
調査によると、ウェブサイトのCAPTCHAに関するユーザーの不満や好みが明らかになったよ。
― 1 分で読む
混合ノイズレベルで同期した音声と映像を生成するモデルを紹介します。
― 0 分で読む
このシステムは、視覚障害者がロボット杖を使ってもっと自立して買い物できるように手助けするよ。
― 1 分で読む
新しい方法で、機械が視覚情報を人間に伝えるのがもっと良くなるんだ。
― 1 分で読む
Seed-TTSは、いろんなアプリ用にテキストからリアルな音声を作るよ。
― 1 分で読む
新しい方法は、物語や因果関係に焦点を当てることで、より良い動画キャプションを作る。
― 1 分で読む
音声キャプショニングに対する新しいアプローチは、ペアデータへの依存を減らす。
― 1 分で読む
ユーザーのアクションに基づいてモバイルアプリのUI変更を予測する新しいアプローチ。
― 1 分で読む
音を使って天文学データをもっと身近で面白くする。
― 1 分で読む
ダンスとテクノロジーを組み合わせてクリエイティブな表現をするプロジェクトだよ。
― 0 分で読む
ReadCtrlは、言語モデルがテキストの複雑さを読者の能力によりよく合わせることを可能にする。
― 1 分で読む
GigaSpeech 2は、音声認識を改善するためのリソースの少ない言語向けの膨大なデータセットを提供してるよ。
― 1 分で読む
正確な手話翻訳における文脈の必要性を考察中。
― 1 分で読む
システムは音声と映像を組み合わせて、スピーカー検出の精度を高めてる。
― 1 分で読む