Un nuovo metodo per allineare le risposte dell'IA con le preferenze umane in modo efficiente.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo per allineare le risposte dell'IA con le preferenze umane in modo efficiente.
― 6 leggere min
Un nuovo approccio per premiare l'over-ottimizzazione nei modelli di linguaggio usando la stima dell'incertezza.
― 7 leggere min
I ricercatori presentano un nuovo modo per allineare enormi sequenze di DNA batterico.
― 6 leggere min
Un nuovo metodo combina modelli linguistici e grafi di conoscenza per migliorare la sicurezza dei robot.
― 7 leggere min
PosFormer migliora il riconoscimento delle espressioni matematiche scritte a mano usando informazioni sulla posizione.
― 6 leggere min
LongRecipe migliora la comprensione dei testi lunghi da parte dei modelli linguistici in modo efficiente.
― 5 leggere min
PF-PPO migliora i modelli linguistici filtrando le ricompense inaffidabili per ottenere risposte di codice migliori.
― 5 leggere min
Un nuovo programma migliora la qualità del test HbA1c nelle cure primarie.
― 6 leggere min
Un nuovo metodo migliora l'accuratezza nella ricerca di persone basandosi su descrizioni.
― 6 leggere min