MMLU-Pro: DieMMLU-Pro: DieNeubewertung vonModellauswertungentestet.die Genauigkeit von SprachmodellenEin neuer Benchmark, der das Denken undRechnen und SpracheMMLU-Pro vorstellen: Ein härterer Benchmark für SprachmodelleMMLU-Pro stellt Sprachmodellen härtere Fragen und mehr Antwortmöglichkeiten.2025-08-03T04:54:48+00:00 ― 7 min Lesedauer