新しいベンチマークCMMLUを通じて、中国語のLLMパフォーマンスを評価中。
― 1 分で読む
最先端の科学をわかりやすく解説
新しいベンチマークCMMLUを通じて、中国語のLLMパフォーマンスを評価中。
― 1 分で読む
人間の入力と機械学習の能力のバランスを探る。
― 1 分で読む
質問に答えるためのLLMの外部ツール利用を評価するために設計されたデータセット。
― 1 分で読む
LLMは、革新的なプロジェクトを通じて化学や材料科学を進展させる可能性を示してるよ。
― 1 分で読む
この記事では、言語モデルがプログラミングの課題をどれだけ理解しているかを探ります。
― 1 分で読む
この研究は、医療の固有表現認識における言語モデルの精度を評価してるよ。
― 1 分で読む
人格特性が言語モデルやそのコミュニケーションにどのように影響するかを調べる。
― 1 分で読む
新しいモデルは、言語理解と画像処理を効率的に結びつける。
― 1 分で読む
AIチャットボットは、医療画像診断の効率とコミュニケーションを向上させて、変革をもたらしているよ。
― 1 分で読む
新しい方法で、大規模言語モデルを使ったバイオメディカル概念のリンクが強化されたよ。
― 1 分で読む
この研究は、LLMが幾何学的な形をどれだけうまく認識し関連付けるかを評価してる。
― 1 分で読む
ソフトウェアのプロパティベーステストにLLMがどう役立つか探ってるんだ。
― 1 分で読む
LLMを使った演繹コーディングは、研究者のコンテンツ分析を効率化するよ。
― 1 分で読む
研究がAIのメンタルヘルスリスク認識の効果を評価してるよ。
― 1 分で読む
この記事では、LLMが否定された質問をどのように処理するかを検討し、改善点を提案しているよ。
― 1 分で読む
LLMが医療タスクに与える影響とその潜在的な応用を評価する。
― 1 分で読む
この研究は、LLMが信頼できる子供向けの物語を作る能力を評価してるよ。
― 1 分で読む
研究がLLMの放射線レポートの解釈における効果を評価してるんだ。
― 1 分で読む
CrystaLLMは、CIFデータを使って結晶構造の作成を早めるためにAIを活用してるよ。
― 1 分で読む
LLMがMBTI分析を通じて人間のような性格を持ってるか調査中。
― 1 分で読む
この記事では、大規模言語モデルを使ってソフトウェアのトレーサビリティを向上させるためのプロンプトの使い方について話してるよ。
― 1 分で読む
研究者たちは、機械が作ったテキストと人間が作ったテキストを識別する方法を開発してる。
― 1 分で読む
LLM統合アプリのSQLインジェクション攻撃に対する脆弱性に関する研究。
― 1 分で読む
新しいアプローチは、言語モデルの評価品質を向上させるために、より広いネットワークを活用している。
― 1 分で読む
研究は、LLMが医療データの抽出と分類を改善する役割を果たしていることを強調している。
― 1 分で読む
この研究は、LLMがGTFSデータをどのように処理して取得できるかを探ってるよ。
― 1 分で読む
ChatGPTを使ったコード生成の予測不可能な性質を調査する。
― 1 分で読む
コード翻訳におけるLLMの限界と改善のためのテクニックを探る。
― 1 分で読む
新しい方法は、複雑なタスクのために言語モデルとプランナーを組み合わせてる。
― 1 分で読む
最近のサミットでのソフトウェアサプライチェーンセキュリティに関するインサイトを探る。
― 1 分で読む
高度なAIツールはマルウェア作成に悪用されることがあり、サイバーセキュリティの懸念が高まってる。
― 1 分で読む
新しい方法が、視覚的な問題解決のために速い思考と遅い思考を組み合わせてるよ。
― 1 分で読む
新しいフレームワークがLLMとKGを組み合わせて、よりパーソナライズされたニュースの提案を実現する。
― 1 分で読む
自動化ツールを使ってソフトウェアをサイドチャネル攻撃から守る方法を学ぼう。
― 1 分で読む
医療関連の質問に言語モデルを使うことの危険性についての分析。
― 1 分で読む
AskItはソフトウェアプロジェクトでのLLM統合を簡単にして、効率を上げてコードの長さを減らすんだよ。
― 1 分で読む
中国でLLMが仕事のダイナミクスをどう変えてるか調べてる。
― 1 分で読む
ロボットがインタラクションを通じて学ぶのにおける言語モデルの役割を探る。
― 1 分で読む
人間とロボットのコミュニケーションに関する重要な問題を探る。
― 1 分で読む
この研究は、LLMが人狼ゲームみたいなコミュニケーションゲームにどう関わるかを調べてるよ。
― 1 分で読む