Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Zilong Zheng

計算と言語 MathBenchを紹介するよ：数学におけるLLMの新しいベンチマークだよ。

MathBenchは、さまざまな教育段階でのLLMの数学能力を評価する。

2025-08-09T21:32:48+00:00 ― 1 分で読む

機械学習大規模言語モデルの安全性を高める

DiveR-CTは、自動化されたレッドチームによる安全性評価を改善する。

2025-08-05T02:44:00+00:00 ― 1 分で読む

計算と言語新しいアテンションメカニズムでトランスフォーマーの効率を向上させる

新しいアプローチがトランスフォーマーモデルを強化して、長文処理をより良くする。

2025-07-24T22:15:54+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ビデオ言語モデルにおける幻覚の評価

新しいベンチマークが、ビデオと言語のモデルが不正確さにどう対処するかを評価するよ。

2025-07-24T17:47:18+00:00 ― 1 分で読む

ロボット工学ロボットが正しい方向を向くことを学ぶ

新しい方法がロボットがタスクのために正しく移動して方向を定めるのを助ける。

2025-07-14T07:05:42+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識検証モジュールで視覚的推論を改善する

この方法は、各推論ステップで検証を実施することで視覚的推論を強化する。

2025-07-02T15:49:48+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識新しいフレームワークがビデオ言語モデルを強化するよ

メモリートークンを使ったフレームワークが、動画の理解とインタラクションを改善する。

2025-06-18T08:10:48+00:00 ― 1 分で読む