コンピューターサイエンス - 人工知能

RSS

ソフトウェア工学 RepoExec: コード生成モデルのための新しいベンチマーク

RepoExecはリポジトリレベルでのコード生成パフォーマンスを評価するよ。

2025-07-27T20:50:18+00:00 ― 1 分で読む

ソフトウェア工学自然言語からコード生成のための新しいフレームワーク

フレームワークは、ドキュメントを使って特化した言語のコード生成を改善する。

2025-07-27T20:42:24+00:00 ― 1 分で読む

機械学習 Job-SDFの紹介：スキル需要予測のための新しいデータセット

Job-SDFは、今日の雇用市場での進化するスキル需要についての洞察を提供します。

2025-07-27T20:34:30+00:00 ― 1 分で読む

人工知能 SD-MDPフレームワークで海上物流を最適化する

新しいアプローチが不確実な海洋環境での意思決定を向上させる。

2025-07-27T20:31:40+00:00 ― 1 分で読む

計算と言語文書分析における条件付き推論の進展

新しいデータセットが、適格性に関する質問のための多文書推論を改善する。

2025-07-27T20:10:48+00:00 ― 1 分で読む

人工知能 STARフレームワーク：AI安全のためのレッドチーミング強化

多様な視点を使ってAIシステムの安全性評価を改善する新しいアプローチ。

2025-07-27T19:47:06+00:00 ― 1 分で読む

生体分子 SCEPTRでTCR特異性予測を進める

SCEPTRは、スパースデータを使ってTCR特異性を効率よく予測する新しい方法を提供するよ。

2025-07-27T19:44:51+00:00 ― 1 分で読む

機械学習専門家のパフォーマンスを超える生成モデル

この記事では、チェスで人間の専門家を上回ることができる生成モデルについて見ていくよ。

2025-07-27T19:39:12+00:00 ― 1 分で読む

計算と言語自己学習法による言語モデルの進展

新しいフレームワークが、言語モデルが人間の入力なしに記号言語を学ぶのを助ける。

2025-07-27T19:31:18+00:00 ― 1 分で読む

計算と言語ネモトロン-4 340Bモデルファミリーを紹介するよ。

Nemotron-4 340Bファミリーは、さまざまなアプリケーションや合成データ生成に強力なモデルを提供するよ。

2025-07-27T18:43:54+00:00 ― 1 分で読む

計算と言語リトリーバル拡張型大規模言語モデルの評価

特定の分野でのリトリーバル強化モデルのパフォーマンスを評価するためのツールキット。

2025-07-27T18:28:06+00:00 ― 1 分で読む

計算と言語ビジョン・ランゲージモデルの文化的バイアス

文化的バイアスがAIの画像理解にどう影響するかを調べる。

2025-07-27T18:12:18+00:00 ― 1 分で読む

計算と言語言語モデルにおけるアンラーニングの評価

新しい方法が言語モデルから知識を忘れることの課題を明らかにしている。

2025-07-27T17:24:54+00:00 ― 1 分で読む

人工知能インターシンボリックAIの未来：二つの世界を融合させる

シンボル的とサブシンボル的な方法を組み合わせたインターシンボリックAIを見て、よりスマートなシステムを目指そう。

2025-07-27T16:45:24+00:00 ― 1 分で読む

計算と言語言語エージェントの進化

言語エージェントはもっと適応できるようになってきて、コミュニケーションや問題解決能力が向上してるね。

2025-07-27T16:37:30+00:00 ― 1 分で読む

機械学習言語モデルにおけるジェンダーバイアスへの対処

研究者たちがAIの性別バイアスに取り組むためにGECOデータセットとGECOBenchを開発した。

2025-07-27T16:21:42+00:00 ― 1 分で読む

計算と言語推論チェーンでマルチホップ質問応答を改善する

新しい方法が複雑な質問応答のための検索強化生成を改善する。

2025-07-27T15:58:00+00:00 ― 1 分で読む

機械学習デュアルトランスフォーマーモデルで実行時間予測を改善する

新しいデュアルトランスフォーマーモデルがソースコード分析からの実行時間予測を改善するよ。

2025-07-27T15:34:18+00:00 ― 1 分で読む

計算と言語 AIシステムにおける監視のリスク

上位のAIモデルを弱いモデルで管理することの難しさを探る。

2025-07-27T15:26:24+00:00 ― 1 分で読む

社会と情報ネットワークドレッジワードで誤情報と戦う

この論文では、ダメなウェブサイトを見つけるための手法を紹介するよ。

2025-07-27T15:18:30+00:00 ― 1 分で読む

計算と言語小さなオープン言語モデルの評価

さまざまなタスクにおける小さいオープン言語モデルの性能についての研究。

2025-07-27T15:02:42+00:00 ― 1 分で読む

計算と言語リファイナー：言語モデルの精度を向上させる

リファイナーは取得した情報を再構成して言語モデルの応答を改善するよ。

2025-07-27T14:31:06+00:00 ― 1 分で読む

ソフトウェア工学 GitHub Copilotのコード生成能力を評価する

様々なプログラミング言語でコードを生成するCopilotの能力に関する研究。

2025-07-27T14:07:24+00:00 ― 1 分で読む

システムと制御サイバー・フィジカルシステムの耐障害性を高める

新しいアプローチが、不確実な環境での強化学習コントローラーのレジリエンスを向上させる。

2025-07-27T14:03:00+00:00 ― 1 分で読む

人工知能 GUICourse データセットで GUI エージェントを進化させる

GUICourseは、GUIエージェントのための特定のデータセットを使ってデジタルインターフェースとのインタラクションを向上させることを目指してるよ。

2025-07-27T13:51:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 VideoVistaの紹介：動画QAの新たなベンチマーク

VideoVistaは、動画の質問応答モデルのための包括的な評価を提供してるよ。

2025-07-27T13:35:48+00:00 ― 1 分で読む

機械学習言語モデルにおけるフェーズ変化の検出

この研究は、言語モデルがトレーニング中にどのように行動を変えるかを明らかにしている。

2025-07-27T13:18:06+00:00 ― 1 分で読む

信号処理統合ネットワークでコミュニケーションを進化させる

CubeSatとドローンを組み合わせて、世界的な通信アクセスを向上させる。

2025-07-27T13:14:25+00:00 ― 1 分で読む

人工知能 AIにおけるハイパーグラフを通じた関係の理解

この記事では、事前学習モデルがハイパーグラフを通じて関係を学ぶ方法を調べる。

2025-07-27T12:56:18+00:00 ― 1 分で読む

機械学習マルチエージェントシステムにおけるパワーバランス

頑丈な協調システムのための電力分配を扱う。

2025-07-27T12:40:30+00:00 ― 1 分で読む

アプリケーション気候変動と汚染：緊急レビュー

汚染と温度上昇の関係を分析して、効果的な政策を考えよう。

2025-07-27T12:29:20+00:00 ― 1 分で読む

サウンドネットワーク分解を使った音声モデルの分析

音声モデルがどうやって予測をするかを理解するための新しい方法。

2025-07-27T12:25:50+00:00 ― 1 分で読む

機械学習言語モデルの決定境界を調べる

大規模言語モデルの意思決定プロセスに関する研究。

2025-07-27T12:24:42+00:00 ― 1 分で読む

機械学習マルチモーダルモデルにおける長いコンテキストの評価

MMNeedleは、マルチモーダルモデルの長いコンテキスト処理能力をベンチマークテストしてるよ。

2025-07-27T12:16:48+00:00 ― 1 分で読む

ソフトウェア工学新しいデータセットでコード検索を強化する

新しいデータセットが、自然言語クエリを使う開発者のコード検索効率を改善するよ。

2025-07-27T11:37:18+00:00 ― 1 分で読む

ソフトウェア工学グラフを使ってソフトウェアの脆弱性予測を改善する

新しい方法は、変数名じゃなくてコードの機能に焦点を当てることで予測を強化してるよ。

2025-07-27T11:05:42+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション薬の安全情報へのアクセスを向上させる

DrugWatchは、ユーザーが薬の安全情報を簡単に見つけるのを助けるよ。

2025-07-27T10:57:48+00:00 ― 1 分で読む

計算と言語テキストから感情とその原因を抽出する

ラベルのないデータで感情やその原因を特定する方法。

2025-07-27T10:42:00+00:00 ― 1 分で読む

機械学習スパースハイランクアダプター（SHiRA）を紹介するよ

SHiRAはAIのモデル切り替え効率をアップさせるけど、重要な概念は失わないよ。

2025-07-27T09:54:36+00:00 ― 1 分で読む

人工知能 APPLの紹介: LLM統合のための新しい言語

APPLは直感的でPythonみたいな文法を使って、大規模言語モデルを使った開発を簡素化するよ。

2025-07-27T09:46:42+00:00 ― 1 分で読む