革新的なデータセット開発を通じて、日本語でDocREのためのリソースを作成中。
― 1 分で読む
最先端の科学をわかりやすく解説
革新的なデータセット開発を通じて、日本語でDocREのためのリソースを作成中。
― 1 分で読む
Common Crawlデータから作られたしっかりした日本語コーパスがLLMのパフォーマンスを向上させるよ。
― 1 分で読む
英語の知識を使って日本語モデルを強化すると、パフォーマンスがかなりアップするよ。
― 1 分で読む
HMoEモデルとその言語処理における利点を見てみよう。
― 1 分で読む
均一サンプリングが自然言語処理におけるトークン化をどう改善するかを探る。
― 1 分で読む
地域の言語で大きな言語モデルを開発する重要性を探る。
― 1 分で読む