ある研究がAIモデルの空間関係の把握を比較してる。
Shang Hong Sim, Clarence Lee, Alvin Tan
― 1 分で読む
最先端の科学をわかりやすく解説
ある研究がAIモデルの空間関係の把握を比較してる。
Shang Hong Sim, Clarence Lee, Alvin Tan
― 1 分で読む
新しいAIモデルの脆弱性と防御策を調べる。
Yangyang Guo, Fangkai Jiao, Liqiang Nie
― 1 分で読む
さまざまな言語の方言でモデルがどれだけ有毒なコメントを検出できるかを調べてる。
Fahim Faisal, Md Mushfiqur Rahman, Antonios Anastasopoulos
― 1 分で読む
MTFusionは画像とテキストを組み合わせて、進化した3Dモデルを作成するんだ。
Yu Liu, Ruowei Wang, Jiaqi Li
― 1 分で読む
ホリスティック入試とその未来の医者への影響について。
Andrew D. Bergemann, Stephen R. Smith, Joel A. Daboub
― 1 分で読む
リアルな素材を作る新しい方法が、アーティストやデザイナーの柔軟性を高めるよ。
Chenliang Zhou, Zheyuan Hu, Alejandro Sztrajman
― 1 分で読む
新しいアプローチが画像とテキストのモデルにおけるバイアスを効果的に解決してるよ。
Haoyu Zhang, Yangyang Guo, Mohan Kankanhalli
― 1 分で読む
新しいベンチマークを使って、言語モデルのコーディングタスクでの効果を評価する。
Nidhish Shah, Zulkuf Genc, Dogu Araci
― 1 分で読む
AIの回答で虚偽情報を減らすために、ナレッジグラフがどう役立つかを理解する。
Ernests Lavrinovics, Russa Biswas, Johannes Bjerva
― 1 分で読む
帰納マップを使ってAIの意思決定モデルを評価する新しいアプローチ。
Lars Nieradzik, Henrike Stephani, Janis Keuper
― 1 分で読む
人間とAIがどうやってうまく協力できるかを調べる。
Filip Ilievski, Barbara Hammer, Frank van Harmelen
― 1 分で読む
LLMが評価プロセスをどう強化するかと、重要な課題にどう対処するかの概要。
Jiawei Gu, Xuhui Jiang, Zhichao Shi
― 1 分で読む
この研究は、LLMが代替用途テストで創造性をどれだけよく評価できるかを調べてるんだ。
Abdullah Al Rabeyah, Fabrício Góes, Marco Volpe
― 1 分で読む
STARは、より賢くて速い結果を得るためのAIモデル構築を自動化します。
Armin W. Thomas, Rom Parnichkun, Alexander Amini
― 1 分で読む
ER 2Scoreは、自動放射線レポートの質評価を向上させるよ。
Yunyi Liu, Yingshu Li, Zhanyu Wang
― 1 分で読む
テキストプロンプトを現実的な動画に変えるために物理法則を取り入れてるんだ。
Qiyao Xue, Xiangyu Yin, Boyuan Yang
― 1 分で読む
大きな言語モデルは信頼できる評価者なの?彼らの評価の一貫性を探る。
Noah Lee, Jiwoo Hong, James Thorne
― 1 分で読む
ChemTEBは専門的なモデルを評価することで、化学テキスト処理を改善するのを手伝うよ。
Ali Shiraee Kasmaee, Mohammad Khodadad, Mohammad Arshi Saloot
― 1 分で読む
AgriBenchは、より賢い農業の意思決定を支援するためのAIツールを評価してるよ。
Yutong Zhou, Masahiro Ryo
― 1 分で読む
SelfPromptが言語モデルの強さを効果的に評価する方法を学ぼう。
Aihua Pei, Zehua Yang, Shunan Zhu
― 1 分で読む
サンドバッグがAIの評価にどんな影響を与えるか、またそれを検出する方法について学ぼう。
Cameron Tice, Philipp Alexander Kreer, Nathan Helm-Burger
― 1 分で読む
研究者たちがシンハラ語のテキストをより理解しやすくするためにどう簡素化しているかを学ぼう。
Surangika Ranathunga, Rumesh Sirithunga, Himashi Rathnayake
― 1 分で読む
TDD-Benchは、TDD手法を使う開発者のための自動テスト生成を強化するよ。
Toufique Ahmed, Martin Hirzel, Rangeet Pan
― 1 分で読む
研究者たちは、より良い理解のためにパラフレーズの監督を使って自動音声認識を強化してるよ。
Amruta Parulekar, Abhishek Gupta, Sameep Chattopadhyay
― 1 分で読む
新しい方法が自動胸部X線レポートの精度を向上させる。
R. Mahmood, K. C. L. Wong, D. M. Reyes
― 1 分で読む
競技ゲームの中でのAIのワクワクする世界を発見しよう。
Chengwei Hu, Jianhui Zheng, Yancheng He
― 1 分で読む
機械翻訳の指標がどうやって公平で一貫性があるかを見てみる。
Pius von Däniken, Jan Deriu, Mark Cieliebak
― 0 分で読む
AIのベンチマークはパフォーマンスを示すけど、現実の使い方をあんまり理解してないことが多いんだよね。
Amelia Hardy, Anka Reuel, Kiana Jafari Meimandi
― 1 分で読む
子供みたいに機械が言語を学ぶ方法を改善することを目的としたコンペ。
Michael Y. Hu, Aaron Mueller, Candace Ross
― 1 分で読む
研究者たちがテキストから画像へのAI精度を向上させる新しい方法を開発した。
Ziyuan Qin, Dongjie Cheng, Haoyu Wang
― 1 分で読む
新しい方法で神経細胞が独立して働けるようになって、ニューラルネットワークのトレーニングが向上したよ。
Deepak Kumar
― 1 分で読む
説明可能な人工知能における評価の問題を探求し、信頼を求める。
Kristoffer Wickstrøm, Marina Marie-Claire Höhne, Anna Hedström
― 1 分で読む
DECOがエンジニアリングの作業をもっと簡単で効率的にする役割を発見しよう。
Yiwen Zhu, Mathieu Demarne, Kai Deng
― 1 分で読む
画像処理の進歩が、コンピュータが視覚コンテンツを理解する方法を変えてるね。
XuDong Wang, Xingyi Zhou, Alireza Fathi
― 1 分で読む
新しい方法が、限られたデータでのパーソナライズド評価におけるLLMのパフォーマンスを向上させる。
Javad Seraj, Mohammad Mahdi Mohajeri, Mohammad Javad Dousti
― 1 分で読む
高校から大学に進む際に、学生が自分の学習プロセスをどう管理しているかを探ること。
Yixin Cheng, Rui Guan, Tongguang Li
― 1 分で読む
モデル予測制御が機械の意思決定能力をどう高めるかを発見しよう。
Kehan Wen, Yutong Hu, Yao Mu
― 1 分で読む
新しいベンチマークが情報検索モデルのためのオランダ語データを強化した。
Nikolay Banar, Ehsan Lotfi, Walter Daelemans
― 1 分で読む
古典的な物体が量子粒子の奇妙な振る舞いとどう関係しているのかを発見しよう。
Giuseppe Nisticò
― 0 分で読む
MALAMUTEデータセットは、教育関連のトピックで言語モデルをテストして、より良い理解を目指してるよ。
Sagi Shaier, George Arthur Baker, Chiranthan Sridhar
― 1 分で読む