RASSARアプリは先進技術を使って家の安全性とアクセシビリティを向上させるよ。
― 1 分で読む
最先端の科学をわかりやすく解説
RASSARアプリは先進技術を使って家の安全性とアクセシビリティを向上させるよ。
― 1 分で読む
新しい方法が聴覚障害者のコミュニケーションを改善することを目指してるよ。
― 1 分で読む
カンナダ語とテルグ語の音声認識精度を向上させる方法。
― 1 分で読む
画像に対してより情報豊かなキャプションを生成する新しいアプローチ。
― 1 分で読む
RALL-Eはテキストから音声への合成を強化して、もっとクリアで自然な発話を実現するよ。
― 1 分で読む
新しい方法で手話の明瞭さと表現力が向上したよ。
― 1 分で読む
画像のテキストレイアウト分析を改善する新しいアプローチを紹介するよ。
― 1 分で読む
UIエージェントを強化することで、より良いユーザー体験が作れるって学ぼう。
― 1 分で読む
新しい方法が直接字幕を作成して、さまざまな視聴者のアクセシビリティを向上させる。
― 1 分で読む
コミュニケーションで感情をもっと上手く表現するために、テクノロジーがどう役立つかを考える。
― 1 分で読む
新しい方法でAIがテキストと画像をつなげて、もっといい結果を出すようになったよ。
― 1 分で読む
調査によると、ウェブサイトのCAPTCHAに関するユーザーの不満や好みが明らかになったよ。
― 1 分で読む
混合ノイズレベルで同期した音声と映像を生成するモデルを紹介します。
― 0 分で読む
このシステムは、視覚障害者がロボット杖を使ってもっと自立して買い物できるように手助けするよ。
― 1 分で読む
新しい方法で、機械が視覚情報を人間に伝えるのがもっと良くなるんだ。
― 1 分で読む
Seed-TTSは、いろんなアプリ用にテキストからリアルな音声を作るよ。
― 1 分で読む
新しい方法は、物語や因果関係に焦点を当てることで、より良い動画キャプションを作る。
― 1 分で読む
音声キャプショニングに対する新しいアプローチは、ペアデータへの依存を減らす。
― 1 分で読む
ユーザーのアクションに基づいてモバイルアプリのUI変更を予測する新しいアプローチ。
― 1 分で読む
音を使って天文学データをもっと身近で面白くする。
― 1 分で読む
ダンスとテクノロジーを組み合わせてクリエイティブな表現をするプロジェクトだよ。
― 0 分で読む
ReadCtrlは、言語モデルがテキストの複雑さを読者の能力によりよく合わせることを可能にする。
― 1 分で読む
GigaSpeech 2は、音声認識を改善するためのリソースの少ない言語向けの膨大なデータセットを提供してるよ。
― 1 分で読む
正確な手話翻訳における文脈の必要性を考察中。
― 1 分で読む
システムは音声と映像を組み合わせて、スピーカー検出の精度を高めてる。
― 1 分で読む
PenSLRは、聴覚障害者や難聴者が手話を使ってコミュニケーションを向上させるのを手助けするよ。
― 1 分で読む
新しいAIシステムが、視覚障害のあるユーザー向けに画面読み上げを改善して、アクセシビリティを向上させるよ。
― 1 分で読む
障害のある人向けに、アクセスしやすく説明可能なAIに注目して。
― 1 分で読む
UniGloRは、グロスなしで手話を翻訳して作成する新しい方法を提供してるよ。
― 1 分で読む
研究は、文化的関連性を通じて視覚障害者向けの画像キャプションを強化する方法を特定している。
― 1 分で読む
インドでのOOV単語の発音を良くするためのTTSシステムを強化する方法。
― 1 分で読む
新しい技術で、少ないデータで合成音声の生成が強化されたよ。
― 1 分で読む
AutoAD-Zeroは、より早く効果的な音声説明のためにビジュアルプロンプトを活用してるよ。
― 1 分で読む
大きなデータセットがスマホを使う聴覚障害者のコミュニケーションをもっと良くするよ。
― 1 分で読む
SLVideoは、ユーザーが手話動画の特定の瞬間を簡単に見つける手助けをするよ。
― 1 分で読む
柔軟なウェアラブルレーダーアンテナが視覚障害者の移動をサポートするよ。
― 1 分で読む
音声コマンドツールは、視覚障害者がアプリを簡単に操作できるようにしてくれるよ。
― 1 分で読む
視覚と言語のモデルを使って、都市マッピングの精度とアクセス性を向上させる。
― 1 分で読む
Magiv2は、視覚障害者のために自動転写を通じてマンガへのアクセスを向上させることを目指しているよ。
― 1 分で読む
革新的なアプリがユーザーが色を効果的に認識して名前を付けるのを助けるよ。
― 1 分で読む