言語モデルに関する最新の記事

計算と言語言語モデルエージェントのためのプロンプト最適化

RePromptを使って、最適化されたプロンプトで言語モデルのパフォーマンスを向上させよう！

2025-07-28T08:41:18+00:00 ― 1 分で読む

計算と言語 RUPBench: 言語モデルのロバスト性を評価する

新しいベンチマークが言語モデルがテキストの変化にどう対処するかを評価する。

2025-07-28T07:06:30+00:00 ― 1 分で読む

計算と言語ユーザーペルソナがAIの応答に与える影響

ユーザーの特性は、言語モデルの反応や安全性に影響を与えるんだよ。

2025-07-27T23:36:12+00:00 ― 1 分で読む

計算と言語リトリーバル拡張型大規模言語モデルの評価

特定の分野でのリトリーバル強化モデルのパフォーマンスを評価するためのツールキット。

2025-07-27T18:28:06+00:00 ― 1 分で読む

機械学習言語モデルにおけるフェーズ変化の検出

この研究は、言語モデルがトレーニング中にどのように行動を変えるかを明らかにしている。

2025-07-27T13:18:06+00:00 ― 1 分で読む

計算と言語言語モデルの計画スキルを向上させる

この記事では、大規模言語モデルの計画能力を向上させる方法について考察します。

2025-07-27T08:35:36+00:00 ― 1 分で読む

計算と言語 DetectBench：言語モデルにおける証拠検出の新しい基準

DetectBenchは、推論タスクにおける隠れた証拠を検出する能力でLLMを評価するよ。

2025-07-27T05:02:18+00:00 ― 1 分で読む

人工知能 LLMsにおけるニューロンの活性化と算術的推論

大規模言語モデルにおける神経細胞の活性化が算数的推論をどう向上させるかを調査中。

2025-07-27T00:17:54+00:00 ― 1 分で読む

計算と言語チェコ語の詩生成の進展

新しいモデルが、より良い韻とリズムでチェコの詩を生成するんだ。

2025-07-26T22:43:06+00:00 ― 1 分で読む

計算と言語言語モデルの推論評価

新しいベンチマークが言語モデルの推論スキルを評価する。

2025-07-26T22:11:30+00:00 ― 1 分で読む

計算と言語言語モデルによる議論のランキングの根拠

言語モデルが議論評価のための説得力のある理由を生成する方法に関する研究。

2025-07-26T20:52:30+00:00 ― 1 分で読む

計算と言語大規模言語モデルの誠実さを評価する

この研究では、LLMの正直さを3つの重要な分野で評価してるよ。

2025-07-26T14:33:18+00:00 ― 1 分で読む

計算と言語言語モデル間のコラボレーションの課題

この記事では、敵対者が言語モデル間のチームワークにどのように影響を与えるかを探ります。

2025-07-26T11:00:00+00:00 ― 1 分で読む

計算と言語インドの言語での多言語言語モデルの評価

10のインド言語における言語モデルの性能に関する包括的な研究。

2025-07-25T17:37:12+00:00 ― 1 分で読む

機械学習あまり一般的じゃない言語のためのコード修正技術を進める

新しい方法があまり使われていないプログラミング言語のコード修復を改善する。

2025-07-25T15:07:06+00:00 ― 1 分で読む

機械学習言語モデルにおける注意メカニズム

アテンションシンクが言語モデルのパフォーマンスにどう影響するか探って、キャリブレーション技術を紹介するよ。

2025-07-25T11:02:12+00:00 ― 1 分で読む

計算と言語 RankAdaptor：モデル圧縮の新しいフロンティア

RankAdaptorは、プルーニングされたAIモデルのファインチューニングを最適化して、効率的にパフォーマンスを向上させるよ。

2025-07-25T10:30:36+00:00 ― 1 分で読む

計算と言語大規模言語モデルにおける盗作対策

PlagBenchとLLMの出力の盗作検出における役割についての研究。

2025-07-25T09:43:12+00:00 ― 1 分で読む

計算と言語言語モデルにおける多段階論理推論の評価

新しいデータセットがLLMsの複雑な論理推論タスクに対する能力を評価してるよ。

2025-07-25T01:57:06+00:00 ― 1 分で読む

計算と言語推論タスクにおける言語転移の検討

この研究は、言語モデルにおける推論スキルが言語間でどのように移転するかを調べてるよ。

2025-07-24T21:20:36+00:00 ― 1 分で読む

機械学習 AI言語モデルにおける自己修正の役割

この記事では、AIモデルが自己修正を通じてミスから学ぶ方法について話してるよ。

2025-07-24T21:04:16+00:00 ― 1 分で読む

計算と言語大規模言語モデルの方位の理解を評価する

この研究は、LLMが方角についてどれくらい上手に推論できるかを評価してるよ。

2025-07-24T19:53:42+00:00 ― 1 分で読む

計算と言語 UNOアリーナを通じて逐次意思決定におけるLLMの評価

この研究は、LLMがゲームの場面でどれだけうまく意思決定を行うかを評価してるよ。

2025-07-24T18:34:42+00:00 ― 1 分で読む

計算と言語ユーザーグループごとの言語モデルのパフォーマンスを調べる

研究が、ユーザーの特徴がLLMの応答や正確性にどう影響するかを明らかにした。

2025-07-24T12:47:06+00:00 ― 1 分で読む

計算と言語 CharED：言語モデル強化の新しい手法

CharEDは、共有ボキャブラリーなしでパフォーマンス向上のために言語モデルを組み合わせてるよ。

2025-07-24T05:48:24+00:00 ― 1 分で読む

計算と言語 RAGシステムの進展：新しい評価フレームワーク

RAGBenchは、リトリーバル拡張生成システムを評価するための包括的なデータセットを紹介してるよ。

2025-07-24T05:24:42+00:00 ― 1 分で読む

計算と言語大規模言語モデルの公平性の課題

AI言語モデルの公平性の問題とその影響を探る。

2025-07-24T05:13:00+00:00 ― 1 分で読む

計算と言語言語モデル用の新しいモデレーションツール

言語モデルとのやり取りの安全性を高めるツールを紹介します。

2025-07-24T00:08:42+00:00 ― 1 分で読む

計算と言語言語モデルツールのサイレントエラーに対処する

この記事では、言語モデルで使われるツールのエラー検出について探ってるよ。

2025-07-23T09:39:42+00:00 ― 1 分で読む

計算と言語言語モデルにおける構文テンプレートの検討

この記事では、言語モデルが生成したテキストの繰り返し構造を分析しているよ。

2025-07-23T01:29:54+00:00 ― 1 分で読む

計算と言語 LLMにおける連続指示のフォローを評価すること

新しいベンチマークが、言語モデルが複数の指示を順番にどれだけうまく処理するかを評価する。

2025-07-22T21:32:54+00:00 ― 1 分で読む

計算と言語 MalAlgoQAで大規模言語モデルをテスト中

MalAlgoQAデータセットは、逆実情シナリオでの大規模言語モデルの推論を評価するんだ。

2025-07-22T07:35:30+00:00 ― 1 分で読む

人工知能 MathCAMPS: 言語モデルを評価する新しいアプローチ

MathCAMPSは、言語モデルの数学的推論を評価する新しい方法を提供してるよ。

2025-07-22T06:56:00+00:00 ― 1 分で読む

計算と言語言語モデルにおける数値表現の向上

この作業は、予測を改善するために数字の埋め込みを使ってより良い数の表現に焦点を当ててるよ。

2025-07-22T06:48:06+00:00 ― 1 分で読む

機械学習デュエリングバンディットでの大規模言語モデルの評価

デュエリングバンディットシナリオを通じてLLMの意思決定の効果を探る。

2025-07-21T23:41:30+00:00 ― 1 分で読む

計算と言語科学研究のための言語モデルの評価

仮説検定における大規模言語モデルを評価するための新しいベンチマーク。

2025-07-21T19:52:24+00:00 ― 1 分で読む

人工知能 CRABの紹介：言語モデルの新しいベンチマーク

CRABはリアルな環境での言語モデルのテストを強化するよ。

2025-07-21T18:41:18+00:00 ― 1 分で読む

機械学習言語モデルのオンデバイス微調整の進展

スマホ上でユーザーデータを守りながら、大型言語モデルを微調整する。

2025-07-21T08:40:54+00:00 ― 1 分で読む

人工知能トランスフォーマーモデルのメカニスティック解釈可能性を解読する

トランスフォーマーベースの言語モデルにおける機械的解釈可能性の概要。

2025-07-21T02:05:54+00:00 ― 1 分で読む

計算と言語視点を変える：r/ChangeMyViewからのインサイト

コミュニティのディスカッションを通じて、リフレーミングが意見をどう変えるか探る。

2025-07-21T01:34:18+00:00 ― 1 分で読む

言語モデル に関する最新の記事

言語モデルに関する最新の記事