評価に関する最新の記事

ソフトウェア工学開発者のためのアクションカテゴライズの強化

ツールはアクションの分類を改善して、開発者のワークフローの効率を助けるよ。

2025-07-08T13:38:06+00:00 ― 1 分で読む

最適化と制御ストレス軽減技術の進展

新しい方法がストレスを効果的に最小化して構造設計を改善する。

2025-07-08T04:02:17+00:00 ― 1 分で読む

計算と言語言語モデルの幻覚対策

新しいベンチマークがLLMの事実正確性を評価する。

2025-07-07T18:08:54+00:00 ― 1 分で読む

計算と言語文書コレクションのタイトルセット評価の新しい方法

人間の参照なしで、もっと早くタイトルセットを評価する新しいアプローチ。

2025-07-07T16:26:12+00:00 ― 1 分で読む

計算と言語ペルソナエージェントの評価: 新しいフレームワーク

言語モデルを使ってペルソナエージェントを評価する新しいアプローチ。

2025-07-07T06:17:54+00:00 ― 1 分で読む

機械学習機械学習モデルの公平性を考える

多様な人々に対して、公平性を確保するために機械学習モデルを評価すること。

2025-07-07T03:30:16+00:00 ― 1 分で読む

計算と言語ダラ: アラビア方言のための新しいツール

ダラはアラビア語の方言をサポートしてて、テキストや画像でのコミュニケーションを良くしてるよ。

2025-07-07T01:33:30+00:00 ― 1 分で読む

計算と言語言語モデルの評価: 新しいツールキット

人間とボットのやり取りをもっと良く評価するためのツールキット。

2025-07-06T18:11:06+00:00 ― 1 分で読む

情報検索 AI注釈を使った情報検索システムの評価

情報検索システムの効率的な評価のためにAI生成の関連マークを使う。

2025-07-06T13:19:08+00:00 ― 1 分で読む

機械学習強化学習アルゴリズム評価のための新しいベンチマーク方法

新しいアプローチが、さまざまな環境での強化学習アルゴリズムの比較をより良くする。

2025-07-06T13:03:00+00:00 ― 1 分で読む

サウンド MuChoMusicベンチマークで音楽理解を評価する

音楽と言語を分析するモデルを評価するための新しいベンチマーク。

2025-07-06T05:29:45+00:00 ― 1 分で読む

人工知能大規模言語モデルの評価：包括的アプローチ

大規模言語モデルを効果的に評価するためのさまざまなフレームワークや方法を探ってみて。

2025-07-06T02:07:18+00:00 ― 1 分で読む

機械学習 AIの決定の解釈可能性手法の評価

AIの意思決定を説明する方法の信頼性を評価する新しいアプローチ。

2025-07-06T01:51:30+00:00 ― 1 分で読む

マルチメディア AxiomVision: 動的環境のためのビデオ分析を革新する

AxiomVisionは、変化する条件下でのパフォーマンスを向上させる新しい動画分析のアプローチを提供してるよ。

2025-07-05T14:40:00+00:00 ― 1 分で読む

機械学習説明可能なAIの評価：BEExAIの台頭

AIシステムの説明可能性手法を評価するための新しいツール。

2025-07-05T10:43:00+00:00 ― 1 分で読む

機械学習バックドア学習評価の標準化：BackdoorBench

BackdoorBenchは、深層ニューラルネットワークにおけるバックスドア学習手法を評価するための統一アプローチを提供します。

2025-07-05T09:47:42+00:00 ― 1 分で読む

計算と言語マルチモーダルLLMのゼロショット能力を評価する

さまざまなタスクにおけるマルチモーダルLLMのゼロショット性能の評価。

2025-07-05T08:36:36+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション AI駆動のツールがアンケート翻訳を簡素化

新しいツールが、アンケートを言語間で翻訳するプロセスを改善するよ。

2025-07-04T18:07:36+00:00 ― 1 分で読む

計算と言語大規模言語モデルにおける論理的推論の評価

研究は、複雑な質問を使って大規模言語モデルの推論スキルを評価してる。

2025-07-04T17:20:12+00:00 ― 1 分で読む

アプリケーション VIEWS予測チャレンジ：紛争による死者数予測

武装紛争における死者数を予測する挑戦、不確実性に焦点を当てて。

2025-07-04T02:04:24+00:00 ― 1 分で読む

材料科学材料科学における構造化データのためのLLMの活用

LLMを使って、材料科学のデータ抽出を効率化する方法を見つけよう。

2025-07-04T01:40:18+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション LLMをナレッジエンジニアリングに取り入れること

知識エンジニアリングにおけるLLMの役割と課題を探る。

2025-07-03T12:45:54+00:00 ― 1 分で読む

計算と言語リトリーバル拡張生成でAIの応答を改善する

新しいフレームワークは、外部データを統合することで言語モデルの精度を向上させるよ。

2025-07-02T02:24:00+00:00 ― 1 分で読む

暗号とセキュリティ Comidds: 侵入検知データセットの新しいリソース

Comiddsは侵入検知研究のためのデータセットに関する更新情報を提供してるよ。

2025-07-02T01:44:30+00:00 ― 1 分で読む

情報検索情報検索における大規模言語モデルのワークショップ

研究者たちは、情報検索システムの評価に対するLLMの影響について語ってるよ。

2025-06-30T04:26:54+00:00 ― 1 分で読む

情報検索現代開発におけるコーディングアシスタントの役割

コーディングアシスタントが開発者のコーディング効率を上げる方法を学ぼう。

2025-06-30T03:39:30+00:00 ― 1 分で読む

計算と言語機械読解力の評価方法を改善する

新しい方法がモデルの言語理解の評価をもっと良くしてるよ。

2025-06-29T22:47:12+00:00 ― 1 分で読む

計算と言語 ProFuserでモデル融合を改善する

言語モデルをもっと効果的に組み合わせる新しい方法。

2025-06-29T22:23:30+00:00 ― 1 分で読む

画像・映像処理口腔癌の早期発見の進展

深層学習を使って口腔扁平上皮癌の早期発見を向上させる。

2025-06-29T18:01:45+00:00 ― 1 分で読む

ソフトウェア工学ハイブリッド量子ソフトウェアにおける分析可能性について

この研究は、分析可能性を通じてハイブリッド量子ソフトウェアの質を向上させることに焦点を当てている。

2025-06-28T16:32:21+00:00 ― 0 分で読む

コンピュータビジョンとパターン認識 MathScapeでMLLMを評価する

MathScapeは、視覚的およびテキストの数学問題を使ってMLLMの評価を向上させる。

2025-06-28T00:02:42+00:00 ― 1 分で読む

計算と言語大規模言語モデルを使った帰納的学習

帰納論理プログラミングにおけるLLMの活用を探る。

2025-06-27T17:43:30+00:00 ― 1 分で読む

計算と言語合成データでリアルなオンラインディスカッションを生成する

言語モデルを使って合成会話を作るための構造化された方法。

2025-06-27T13:46:30+00:00 ― 1 分で読む

計算と言語新しいベンチマークがアラビア語モデルの法律知識を評価するよ

ArabLegalEvalは、アラビア語の法律情報を扱うLLMのパフォーマンスを評価するよ。

2025-06-27T05:52:30+00:00 ― 1 分で読む

情報検索 VERA: RAGシステム評価のフレームワーク

VERAがRAGシステムの評価精度と効率をどう向上させるかを知ってみて。

2025-06-27T04:33:30+00:00 ― 1 分で読む

機械学習実世界で使うための大規模言語モデルの評価

多様な評価セットを使ってLLMを評価する新しいアプローチ。

2025-06-26T22:53:48+00:00 ― 1 分で読む

計算と言語言語モデルにおけるフォーマットバイアスの対処

この記事では、フォーマットバイアスが言語モデルのパフォーマンスにどのように影響するかを調べて、改善策を提案してるよ。

2025-06-26T20:23:42+00:00 ― 1 分で読む

情報検索 Hindi-BEIR: ヒンディー情報検索のベンチマーク

Hindi-BEIRは、ヒンディー語のコンテンツの情報検索システムを改善することを目指している。

2025-06-26T06:50:00+00:00 ― 1 分で読む

計算と言語オンラインコミュニティと合わせた言語モデルの調整

オンライングループとLLMをうまく合わせて、より良い洞察を得る方法を探ってる。

2025-06-26T04:59:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識手話の熟練度を評価する新しいツール

自然な動作分析を通じて手話のスキルを評価するために設計されたツール。

2025-06-25T19:14:48+00:00 ― 1 分で読む

評価 に関する最新の記事

評価に関する最新の記事