評価に関する最新の記事

計算と言語法律文書分析における自動化されたインサイト

新しい方法が、自動テキスト分析を使って法的判断のパターンを明らかにするんだ。

2025-09-19T06:21:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識スマートフォンの画像処理の進化

異なるスマホ間で一貫した写真品質を実現するモデル。

2025-09-18T16:39:24+00:00 ― 1 分で読む

情報検索代替品でファッションおすすめを改善する

代替案を提案することで、ファッション推薦システムのユーザー満足度を高められるよ。

2025-09-17T15:30:30+00:00 ― 1 分で読む

計算と言語高校の数学コンペでのLLMの評価

新しいデータセットが言語モデルの高度な数学問題解決能力を評価してるよ。

2025-09-17T08:47:36+00:00 ― 1 分で読む

ソフトウェア工学モデル評価におけるデータセット間のコード重複の解消

データセット間のコード重複がモデルのパフォーマンス指標に与える影響を調査中。

2025-09-17T01:33:06+00:00 ― 1 分で読む

機械学習ブラジルポルトガル語のテキスト生成のためのRAG改善

この研究は、ブラジルポルトガル語の情報検索強化生成手法の向上に焦点を当てている。

2025-09-17T00:53:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 WAVES：画像透かしの新しいベンチマーク

この研究では、さまざまな攻撃に対するウォーターマーキング技術を評価するためのベンチマークWAVESを紹介するよ。

2025-09-16T13:42:06+00:00 ― 1 分で読む

計算と言語オリオン-14B: 言語モデルの新しい時代

Orion-14Bは140億のパラメータで多言語テキストを理解して生成するのが得意だよ。

2025-09-15T17:49:12+00:00 ― 1 分で読む

情報検索対話システムにおけるペルソナ評価

新しい方法が対話システムがどれだけパーソナリティの一貫性を保っているかを評価する。

2025-09-15T11:14:12+00:00 ― 0 分で読む

計算と言語 NLPにおける知識構成の新しいアプローチ

このフレームワークは、機械学習モデルで知識を組み合わせる方法を強化して、パフォーマンスを向上させるんだ。

2025-09-14T22:59:30+00:00 ― 1 分で読む

人工知能 PETレポートを要約するための言語モデルの利用

研究によると、言語モデルは有用なPETレポートの印象を生成できることがわかった。

2025-09-14T07:36:21+00:00 ― 1 分で読む

計算と言語医療診断における大規模言語モデルの評価

画像や症状から医療疾患を診断するLLMの精度を評価する。

2025-09-13T23:41:12+00:00 ― 1 分で読む

計算と言語放射線レポートにおけるAI評価の改善

この研究は、専門家の協力を通じてAI生成の放射線レポート評価を向上させるよ。

2025-09-13T18:56:48+00:00 ― 1 分で読む

コンピュータと社会生成AIの安全性評価：レッドチームの役割

レッドチームがAIの安全性を高めて潜在的なリスクに対処する方法を分析中。

2025-09-13T12:13:54+00:00 ― 1 分で読む

コンピュータと社会 AIモデルにおけるハームアンプリフィケーションへの対処

テキストから画像モデルにおける害の増幅とその社会的影響を調査中。

2025-09-12T18:11:36+00:00 ― 1 分で読む

計算と言語人間の好みに合わせた言語モデルの調整

この論文では、言語モデルを人間の価値観や期待に合わせるための調整について話してるよ。

2025-09-12T13:03:30+00:00 ― 1 分で読む

計算と言語透明なオープン言語モデルの紹介

自然言語処理の研究と革新のための新しいオープン言語モデル。

2025-09-12T09:14:24+00:00 ― 1 分で読む

サウンドスピーカー匿名化の新しいフレームワーク

音声プライバシー研究を強化するための柔軟なフレームワークを紹介します。

2025-09-12T05:05:10+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション EvaLLM: AI生成ビジュアライゼーション評価のためのフレームワーク

EvaLLMは、AI生成のビジュアルコンテンツを評価するための構造化されたアプローチを提供しているよ。

2025-09-11T21:07:36+00:00 ― 1 分で読む

機械学習機械学習の信頼性を確保する：新しいアプローチ

機械学習モデルの信頼性と透明性を高めるための検証方法。

2025-09-11T16:15:18+00:00 ― 1 分で読む

計算と言語 SIDU-TXTを使ったAIの理解: 新しいアプローチ

SIDU-TXTは自然言語処理におけるAIの決定についての情報を提供してるよ。

2025-09-11T02:57:24+00:00 ― 1 分で読む

科学コミュニケーションと教育学術研究評価における性別バイアス

研究によると、女性はアカデミアでの評価や資金調達においてバイアスに直面している。

2025-09-11T00:05:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識手書きのメモをデジタルインクに変換する

新しい方法が手書きのノートをデジタルインクに変換して、簡単に使えるようにしてるよ。

2025-09-09T20:56:12+00:00 ― 0 分で読む

ソフトウェア工学ソフトウェア障害予測の再現性の課題

ディープラーニングソフトウェアの欠陥予測研究における再現性問題の分析。

2025-09-09T19:21:24+00:00 ― 0 分で読む

計算と言語テキスト生成における名前の混乱の解決

新しい方法であいまいな名前のコンピュータ生成テキストのファクトチェックが改善された。

2025-09-09T17:30:48+00:00 ― 1 分で読む

マルチメディアシンプルな指標で効果的なポスターデザイン

メッセージを明確に魅力的に伝えるポスターのデザインを学ぼう。

2025-09-09T08:49:24+00:00 ― 1 分で読む

機械学習 AIのトレーニングにおけるリワードハッキングへの対処

AIモデルのトレーニングにおける報酬ハッキングの課題と解決策を探る。

2025-09-09T06:58:48+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識視覚的質問応答モデル評価の新しいフレームワーク

画像に関連するクエリに対するモデルの反応を評価する新しい方法。

2025-09-09T06:11:24+00:00 ― 1 分で読む

音声・音声処理 AV-SUPERBを紹介するよ：音声・映像モデルの新しいベンチマークだ！

AV-SUPERBは、より良いパフォーマンスのためにさまざまなタスクで音声と視覚のモデルを評価するよ。

2025-09-08T22:32:35+00:00 ― 1 分で読む

計算と言語参照表現生成モデルの評価

新しい方法がコンピューター生成のテキストを評価するやり方を改善してるよ。

2025-09-08T20:18:54+00:00 ― 1 分で読む

人工知能サイバーセキュリティにおける大規模言語モデルの評価

CyberMetricによるサイバーセキュリティにおけるAIと人間の専門家の評価を詳しく見てみよう。

2025-09-08T19:39:24+00:00 ― 1 分で読む

機械学習 AIにおけるマシンアンラーニングの必要性

AIモデルにおける選択的な記憶除去を通じた倫理的懸念への対処。

2025-09-08T16:53:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識テキストから画像生成の進展

機械がテキストプロンプトからどんなふうに画像を作るか、そして人間の好みにどう合うかを探る。

2025-09-08T11:29:36+00:00 ― 1 分で読む

計算と言語言語モデルにおけるパーソナライズの進展

この研究は、言語モデルにおけるパーソナライズされた応答のメリットを調べてるよ。

2025-09-08T05:02:30+00:00 ― 1 分で読む

情報検索レコメンダーシステムのベンチマーク戦略

多様なデータセットを使ってRecSysアルゴリズムを評価・比較する新しいアプローチ。

2025-09-07T16:00:24+00:00 ― 1 分で読む

計算と言語質問応答評価方法の改善

人間みたいな判断でAIの回答の正しさを評価する新しい枠組み。

2025-09-07T13:06:36+00:00 ― 1 分で読む

計算と言語言語モデルを使って科学教育を強化する

言語モデルは、個別のサポートを提供することで科学学習を向上させることを目指してるんだ。

2025-09-07T12:27:06+00:00 ― 1 分で読む

機械学習 TimeSeriesBenchを使った時系列異常検知の評価

時系列異常検知手法を改善するためのベンチマークツール。

2025-09-07T10:04:54+00:00 ― 1 分で読む

計算と言語言語モデルの判断におけるバイアス

研究によって、人間とLLMの応答評価における重大なバイアスが明らかになったよ。

2025-09-07T05:12:36+00:00 ― 1 分で読む

計算と言語医療AIの評価：Med-MLLMの新しいベンチマーク

このベンチマークは、医療における医療言語モデルのパフォーマンスを評価するよ。

2025-09-07T01:47:12+00:00 ― 1 分で読む

評価 に関する最新の記事

評価に関する最新の記事