評価に関する最新の記事

計算と言語テーブルベースの質問応答のための効果的なアプローチの組み合わせ

新しい手法で、2つのシステムを統合することで、表からの質問に対する回答の正確性が向上した。

2025-06-05T14:34:54+00:00 ― 1 分で読む

計算と言語効果的な引っかけ選択肢：選択式問題を強化する

教育的な評価で魅力的なディストラクターを生成する新しい方法。

2025-06-05T07:44:06+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション自動Altテキスト生成でアクセシビリティを向上させる

新しい方法が、視覚障害者を助けるためにモバイルアプリのアイコンの代替テキストを強化することを目指してるんだ。

2025-06-05T04:10:48+00:00 ― 1 分で読む

人工知能 DREAMSを紹介するよ: EEGデータ分析の新しいフレームワーク

DREAMSはEEGデータの深層学習を簡単にして、透明性と倫理的な実践を促進してるよ。

2025-06-04T22:39:00+00:00 ― 1 分で読む

計算と言語 AIの説明の信頼性を評価する

AIの説明の信頼性を敵対的感度を通じて評価する方法を見てみよう。

2025-06-04T21:27:54+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識新しいモデルがマルチモーダルAIを変革中

最近のモデルは、AIのさまざまなメディアを生成したり理解したりする能力を高めてるね。

2025-06-04T08:49:30+00:00 ― 1 分で読む

機械学習 ARLBench: 強化学習におけるハイパーパラメータ最適化の新しいアプローチ

ARLBenchは、効率的なベンチマークツールを使って強化学習のハイパーパラメータ調整を簡単にするよ。

2025-06-04T08:02:06+00:00 ― 1 分で読む

画像・映像処理医療画像におけるセグメンテーションの品質評価

グラウンドトゥルースのベンチマークなしでセグメンテーションの質を評価するモデル。

2025-06-03T22:35:30+00:00 ― 1 分で読む

ロボット工学センサーデータ分類による自動運転車の安全性向上

自動運転車のための安全性向上に向けた矛盾するセンサーデータを管理する方法。

2025-06-03T04:15:12+00:00 ― 1 分で読む

音声・音声処理 ESPnet-Codecによるニューラルコーデックの進展

ESPnet-Codecは、音声やオーディオのニューラルコーデックのトレーニングと評価を強化するよ。

2025-06-03T03:09:30+00:00 ― 1 分で読む

データベース安全なデータ共有：新しいアプローチ

プライバシーを守りながら安全にデータ共有するための三つのステップ。

2025-06-02T09:33:24+00:00 ― 1 分で読む

医療情報学医療における大規模言語モデルの評価：ClinicBenchの紹介

新しいベンチマークが臨床意思決定のためのLLMの評価のギャップに対応してる。

2025-06-01T19:51:00+00:00 ― 1 分で読む

プログラミング言語可視化でデバッグを簡単にする

関数型プログラムを可視化すると、プログラマーのデバッグプロセスが簡単になることがあるよ。

2025-06-01T18:40:42+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションデザインにおける生成AI：新しいアプローチ

生成AIがインタラクションデザインプロセスにどんな影響を与えているかを探る。

2025-05-31T19:46:06+00:00 ― 1 分で読む

計算と言語テキストの中の価値を分析する

この研究は、人間とAIが生成したテキストの価値を検証して、より良い理解を目指してるよ。

2025-05-30T00:09:27+00:00 ― 1 分で読む

生物情報学ネットワークバイオロジーの影響を理解する

NetworkCommonsは、分子間相互作用を研究するための新しいツールだよ。

2025-05-28T22:38:52+00:00 ― 1 分で読む

機械学習自己学習による言語モデルの改善

新しいフレームワークが、質の高い理由付けで言語モデルの推論を強化する。

2025-05-26T10:14:42+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 AIの空間関係の理解を評価する

ある研究がAIモデルの空間関係の把握を比較してる。

2025-05-24T20:50:06+00:00 ― 1 分で読む

暗号とセキュリティビジョン大規模言語モデルの課題を乗り越える

新しいAIモデルの脆弱性と防御策を調べる。

2025-05-23T22:25:57+00:00 ― 1 分で読む

計算と言語方言における有害な言語検出の評価

さまざまな言語の方言でモデルがどれだけ有毒なコメントを検出できるかを調べてる。

2025-05-21T20:24:27+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 MTFusion: 3Dモデリングの新しいアプローチ

MTFusionは画像とテキストを組み合わせて、進化した3Dモデルを作成するんだ。

2025-05-20T18:44:33+00:00 ― 1 分で読む

医学教育医学校の入学選考を見直そう

ホリスティック入試とその未来の医者への影響について。

2025-05-20T15:45:18+00:00 ― 1 分で読む

グラフィックスデジタルビジュアルのための革新的な材料合成

リアルな素材を作る新しい方法が、アーティストやデザイナーの柔軟性を高めるよ。

2025-05-20T13:57:27+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識視覚と言語のモデルにおけるバイアスへの対処

新しいアプローチが画像とテキストのモデルにおけるバイアスを効果的に解決してるよ。

2025-05-18T13:16:00+00:00 ― 1 分で読む

ソフトウェア工学コーディング支援のための言語モデルの評価

新しいベンチマークを使って、言語モデルのコーディングタスクでの効果を評価する。

2025-05-15T17:42:40+00:00 ― 1 分で読む

計算と言語言語モデルの幻覚を解消する

AIの回答で虚偽情報を減らすために、ナレッジグラフがどう役立つかを理解する。

2025-05-14T12:34:40+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識新しい手法でアトリビューションマップの評価が改善された

帰納マップを使ってAIの意思決定モデルを評価する新しいアプローチ。

2025-05-12T12:26:40+00:00 ― 1 分で読む

人工知能人間とAIのコラボレーションの重要性が増してるよ

人間とAIがどうやってうまく協力できるかを調べる。

2025-05-11T14:04:00+00:00 ― 1 分で読む

計算と言語大規模言語モデルの評価: メリットとデメリット

LLMが評価プロセスをどう強化するかと、重要な課題にどう対処するかの概要。

2025-05-11T11:57:20+00:00 ― 1 分で読む

人工知能 LLMはクリエイティビティを公平に評価できるの？

この研究は、LLMが代替用途テストで創造性をどれだけよく評価できるかを調べてるんだ。

2025-05-11T10:16:00+00:00 ― 1 分で読む

機械学習 STAR: AIモデル設計の新しいアプローチ

STARは、より賢くて速い結果を得るためのAIモデル構築を自動化します。

2025-05-07T04:30:40+00:00 ― 1 分で読む

計算と言語 ER 2スコア：放射線報告を評価する新しい方法

ER 2Scoreは、自動放射線レポートの質評価を向上させるよ。

2025-05-05T22:57:20+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 PhyT2V: 動画制作を現実にする

テキストプロンプトを現実的な動画に変えるために物理法則を取り入れてるんだ。

2025-04-30T02:21:20+00:00 ― 1 分で読む

計算と言語言語モデルの評価: 一貫性が大事

大きな言語モデルは信頼できる評価者なの？彼らの評価の一貫性を探る。

2025-04-29T21:17:20+00:00 ― 1 分で読む

計算と言語 ChemTEB: 化学テキスト埋め込みの新しいベンチマーク

ChemTEBは専門的なモデルを評価することで、化学テキスト処理を改善するのを手伝うよ。

2025-04-29T20:26:40+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識アグリベンチ：農業技術の未来

AgriBenchは、より賢い農業の意思決定を支援するためのAIツールを評価してるよ。

2025-04-29T14:57:20+00:00 ― 1 分で読む

計算と言語大規模言語モデルの評価: 新しいアプローチ

SelfPromptが言語モデルの強さを効果的に評価する方法を学ぼう。

2025-04-27T12:04:45+00:00 ― 1 分で読む

人工知能サンドバッグの正体を暴く: AIの隠れたリスク

サンドバッグがAIの評価にどんな影響を与えるか、またそれを検出する方法について学ぼう。

2025-04-25T09:07:00+00:00 ― 1 分で読む

計算と言語シンハラ語のテキストを読みやすくする

研究者たちがシンハラ語のテキストをより理解しやすくするためにどう簡素化しているかを学ぼう。

2025-04-23T08:02:30+00:00 ― 1 分で読む

ソフトウェア工学 TDD-Benchでソフトウェアテストを革新しよう！

TDD-Benchは、TDD手法を使う開発者のための自動テスト生成を強化するよ。

2025-04-21T20:10:45+00:00 ― 1 分で読む

評価 に関する最新の記事

評価に関する最新の記事