Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

# コンピューターサイエンス # 計算と言語

新しいデータ手法で大規模言語モデルを改善する

大型言語モデルのための指示調整データを集める新しい方法。

2025-09-28T11:48:48+00:00 ― 1 分で読む

目次

オリジナルソース
参照リンク

高品質な指示調整データは、大規模言語モデル（LLM）を向上させるために重要なんだ。今のデータ収集方法は、高いコストがかかったり、正確じゃなかったりすることが多いから、手動でラベル付けしたり、LLMが自分でタスクを作ったりするのに頼ってると、間違いが起きることがある。この研究は、自動的にこのデータを集める新しい方法を紹介してる。人が書いたテキストを使って、タスクを作るために言語モデルを訓練することで、プロセスが改善されるんだ。

オリジナルソース

タイトル: DoG-Instruct: Towards Premium Instruction-Tuning Data via Text-Grounded Instruction Wrapping

概要: The improvement of LLMs' instruction-following capabilities relies heavily on the availability of high-quality instruction-response pairs. Unfortunately, the current methods used to collect the pairs suffer from either unaffordable labor costs or severe hallucinations in the self-generation of LLM. To tackle these challenges, this paper proposes a scalable solution. It involves training LLMs to generate instruction-response pairs based on human-written documents, rather than relying solely on self-generation without context. Our proposed method not only exploits the advantages of human-written documents in reducing hallucinations but also utilizes an LLM to wrap the expression of documents, which enables us to bridge the gap between various document styles and the standard AI response. Experiments demonstrate that our method outperforms existing typical methods on multiple benchmarks. In particular, compared to the best-performing baseline, the LLM trained using our generated dataset exhibits a 10\% relative improvement in performance on AlpacaEval, despite utilizing only 1/5 of its training data. Furthermore, a comprehensive manual evaluation validates the quality of the data we generated. Our trained wrapper is publicly available at https://github.com/Bahuia/Dog-Instruct.

著者: Yongrui Chen, Haiyun Jiang, Xinting Huang, Shuming Shi, Guilin Qi

最終更新: 2024-05-25 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2309.05447

ソースPDF: https://arxiv.org/pdf/2309.05447

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

参照リンク

https://github.com/goodfeli/dlbook_notation

参照トピック

著者たちからもっと読む

計算と言語マルチモーダル言語モデルの進展

新しいフレームワークが言語モデルを強化して、テキストと画像を組み合わせたよりリッチなインタラクションを実現するよ。

2025-09-26T23:20:30+00:00 ― 0 分で読む

計算と言語機械翻訳の課題と進歩

翻訳技術の障害と進展についての考察。

2025-09-16T16:04:18+00:00 ― 1 分で読む

計算と言語不確実性を考慮した言語モデルの評価

この研究は、言語モデルの評価において不確実性を測ることの重要性を強調してるよ。

2025-09-14T23:31:06+00:00 ― 1 分で読む

人工知能 KGrootを使って障害の特定を改善する

KGrootは、高度な知識グラフを使ってマイクロサービスの障害診断を強化します。

2025-09-09T07:38:18+00:00 ― 1 分で読む

計算と言語大規模言語モデルと知識グラフの理解

研究によると、LLMは整理されていない知識でもうまく処理できるんだって。

2025-09-06T20:23:18+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識マルチモーダルモデルのための機械的アンラーニングの進展

新しい方法がモデルが特定のビジュアル情報を忘れる能力を高める。

2025-08-09T09:26:00+00:00 ― 1 分で読む

計算と言語言語モデルにおけるアラインメント税の対処

新しいフレームワークがデータのバイアスを減らして、言語モデルの指示に従うパフォーマンスを向上させるんだ。

2025-08-08T19:20:42+00:00 ― 1 分で読む

機械学習 AIシステムの神経活性を解読する

神経活性を解釈する新しい方法はAIの安全性と制御を高める。

2025-08-06T03:29:12+00:00 ― 1 分で読む

類似の記事

機械学習量子化テンソルネットワークを使った機械学習の進展

新しい技術が量子化テンソルネットワークを使ってモデルの効率と予測精度を向上させてるよ。

2025-09-28T11:40:54+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識マルチIODを使ったクラス増分学習の進展

リハーサルなしで効率的な物体検出のためのMultIODを紹介します。

2025-09-28T11:17:12+00:00 ― 1 分で読む

ロボット工学人間-ロボットの動作再ターゲティングの進展

新しい方法がロボットの人間の動きの真似を強化して、インタラクションが改善されてるよ。

2025-09-28T11:09:18+00:00 ― 1 分で読む

機械学習多変量時系列データ分析の新しい方法

複雑なセンサーデータを時間をかけて分析する新しいアプローチを紹介するよ。

2025-09-28T11:01:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 SparseSwinの紹介: 画像分類の新しいアプローチ

SparseSwinは、少ないパラメータで高精度な画像分類を提供するよ。

2025-09-28T10:29:48+00:00 ― 1 分で読む

機械学習ニューラルネットワークと不規則データで予測を進める

新しいニューラルネットワークのアプローチが不完全なデータを使って動的システムの変化を予測するんだ。

2025-09-28T10:14:00+00:00 ― 1 分で読む

計算と言語 AIにおけるバイアスへの対処：ニュージーランドの視点

ニュージーランドで、代表されていないグループに影響を与えるAIのバイアスに関する研究が注目されてる。

2025-09-28T10:06:06+00:00 ― 1 分で読む

機械学習圧縮された数値フォーマットによるAIの効率化

圧縮フォーマットがAIのパフォーマンスを向上させる役割を発見しよう。

2025-09-28T09:58:12+00:00 ― 1 分で読む