LLMsが例を使ってプログラミングの課題にどう取り組むかを見てみよう。
― 1 分で読む
最先端の科学をわかりやすく解説
LLMsが例を使ってプログラミングの課題にどう取り組むかを見てみよう。
― 1 分で読む
研究は、人間のフィードバックを使って言語モデルを強化する方法を強調している。
― 1 分で読む
研究者たちは、ビデオ分析を通じて機械が日常活動を理解する能力を向上させようとしてるんだ。
― 1 分で読む
新しいシステムが音声とノイズを分けて、よりクリアなコミュニケーションを助けるよ。
― 1 分で読む
テキストの質が言語モデルにおける確率とどう関係しているかを見てみよう。
― 1 分で読む
新しい方法が言語モデルの人間の好みの理解を深めるかもしれない。
― 1 分で読む
AIが対話ベースの理解と応答の正確性をどう向上させるかを探る。
― 1 分で読む
新しいデータセットがエゴセントリックな動画視聴者にリアルタイムのアクション提案を生成するよ。
― 1 分で読む
言語モデルの言い回しの違いをテストするためのデータセット。
― 1 分で読む
公共スペースでロボットデザインを改善するための注釈付きポートフォリオを探る。
― 1 分で読む
ケンタウロスは人間の洞察とAIを組み合わせて、いろんな分野での意思決定を改善してるんだ。
― 1 分で読む
AIシステムの理解を評価するための明確なフレームワーク。
― 1 分で読む
AIが生成する回答の精度を向上させる方法。
― 1 分で読む
この研究は、言語モデルがゲームを使ってどれだけ社会的状況を理解しているかを評価してるよ。
― 1 分で読む
この記事では、データポイズニングが言語モデルのアライメントに与える影響を探る。
― 1 分で読む
AIの仕事や人との関わりにおける役割を探る。
― 1 分で読む
エラー・スパン・アノテーションは、翻訳の質評価に対して速くて信頼できるアプローチを提供するよ。
― 1 分で読む
この研究は、ストーリーテリングを通じて機械の共感を高める方法を調査してるよ。
― 1 分で読む
LLMは人間の評価者が有害なオンラインコンテンツを効果的に特定するのを手助けするよ。
― 1 分で読む
言語モデルが議論評価のための説得力のある理由を生成する方法に関する研究。
― 1 分で読む
このベンチマークは、ドキュメント作成や改善みたいなBPMタスクでマルチモーダルモデルを評価するんだ。
― 1 分で読む
新しいテスト方法を通して、LLMがどんな性格特性を持ってるかを調べてるんだ。
― 1 分で読む
EEGとfTCDを組み合わせると、障害のある人たちのコミュニケーションがよくなるよ。
― 1 分で読む
人間のフィードバックとサブオプティマルな例を通じて機械学習を強化する新しい方法。
― 1 分で読む
iWISDMを紹介するよ。ビジュアルと言語を使った機械指示のフォローを評価するための新しいベンチマークだ。
― 1 分で読む
LiveMindは、ユーザーとのより速いリアルタイムな対話のために言語モデルを強化します。
― 1 分で読む
人間のフィードバックで訓練されたモデルの過剰最適化を最小限に抑える方法を紹介します。
― 1 分で読む
研究によると、触ることでバーチャルオブジェクトの記憶が向上するらしいよ。
― 1 分で読む
現在のモデルは空間的推論が苦手で、画像よりもテキストに頼っているんだ。
― 1 分で読む
腐敗したフィードバックを使ってAIの人間の価値観との整合性を向上させる新しい方法。
― 1 分で読む
音声における音韻変化に対する機械の適応に関する研究。
― 1 分で読む
10のインド言語における言語モデルの性能に関する包括的な研究。
― 1 分で読む
新しいシステムがいろんなアプリ用のリアルタイム手のジェスチャー認識を改善したよ。
― 1 分で読む
GIEBenchは、さまざまなグループのアイデンティティに基づいてLLMの共感的な応答を評価するんだ。
― 1 分で読む
研究によると、モデルは料理レシピのステップ間の依存性に苦しんでいる。
― 0 分で読む
AIモデルが人間の選択をどう解釈しているか、そして改善の必要性を見てみよう。
― 1 分で読む
テキストから画像へのモデルのための細かいフィードバックを調査して、その実際の影響を考える。
― 1 分で読む
言語モデルを使って強化学習エージェントのための報酬を定義する新しい方法。
― 1 分で読む
研究は、MLLMsが視覚データをどれだけうまく解釈できるか、そしてそのパフォーマンスが人間と比べてどうかを評価している。
― 1 分で読む
新しい方法でARとVRのための手と顔のインタラクションの再構築が改善される。
― 1 分で読む