DetectBench valuta i LLM sulla loro capacità di individuare prove nascoste nei compiti di ragionamento.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
DetectBench valuta i LLM sulla loro capacità di individuare prove nascoste nei compiti di ragionamento.
― 6 leggere min
Esaminando le difficoltà di tradurre il linguaggio metaforico nella traduzione automatica.
― 6 leggere min
GIEBench valuta le risposte empatiche degli LLM in base a diverse identità di gruppo.
― 7 leggere min
I-SHEEP permette ai grandi modelli di linguaggio di imparare continuamente dai dati generati.
― 6 leggere min
Un nuovo strumento valuta le prestazioni dei modelli di linguaggio su diversi tipi di dati.
― 5 leggere min
Scopri le novità nella creazione di video lunghi che catturano l'attenzione del pubblico.
― 6 leggere min