Ludwig Schmidt

Objaverse-XLは、先進的な技術開発のために1000万以上の多様な3Dオブジェクトを提供してるよ。

2025-10-21T11:21:54+00:00 ― 1 分で読む

より良いキャプションは、ウェブから取得した画像を使ってマルチモーダルモデルのパフォーマンスを向上させることができる。

2025-10-18T05:01:24+00:00 ― 1 分で読む

この研究は、事前トレーニングデータがさまざまなタスクにおけるモデルのロバスト性にどんな影響を与えるかを調べてるよ。

2025-10-16T07:28:00+00:00 ― 1 分で読む

OpenFlamingoは、画像とテキストをつなぐモデルをトレーニングするための多用途なプラットフォームを提供してるよ。

2025-10-13T05:28:12+00:00 ― 1 分で読む

データフィルタリングネットワークが機械学習のデータセットやモデルのパフォーマンスに与える影響を発見しよう。

2025-09-20T06:42:30+00:00 ― 1 分で読む

この研究は、言語モデルのトレーニングを最適化して、実際のパフォーマンスを予測することに焦点を当てているんだ。

2025-08-29T16:12:18+00:00 ― 1 分で読む

この研究は、テキストから画像生成の空間的精度を向上させることに焦点を当ててるよ。

2025-08-23T15:53:54+00:00 ― 1 分で読む

研究によると、CLIPは画像認識で疑わしい特徴に依存しているらしい。

2025-08-19T07:53:04+00:00 ― 1 分で読む

非英語のデータを含めることで、視覚言語モデルのパフォーマンスと文化理解が向上する。

2025-08-06T05:35:36+00:00 ― 1 分で読む

VLMは画像分類が苦手だけど、データ統合をうまくやれば能力がアップするよ。

2025-08-05T22:05:18+00:00 ― 1 分で読む

言語モデルを活用すると、さまざまな分野で表形式データの予測が向上するんだ。

2025-07-27T22:01:24+00:00 ― 1 分で読む

MINT-1Tは、マルチモーダルモデルをトレーニングするための最大のオープンソースデータセットだよ。

2025-07-27T13:20:00+00:00 ― 1 分で読む

限られたリソースで言語モデルのトレーニングを改善するガイド。

2025-07-23T08:44:24+00:00 ― 1 分で読む

新しい手法が合成データの質を向上させて、言語モデルの整合性を良くする。

2025-06-30T13:24:06+00:00 ― 1 分で読む

xGen-MMは、画像とテキストの学習をより良くするためにマルチモーダルモデルを強化するんだ。

2025-06-27T00:04:54+00:00 ― 1 分で読む

KALEは、より良い理解のために画像と豊かなキャプションを組み合わせるよ。

2025-05-26T04:48:27+00:00 ― 1 分で読む