¿Qué significa "PARAÍSO"?
Tabla de contenidos
PARADISE es un proyecto que investiga qué tan bien los modelos de lenguaje pueden planear y llevar a cabo tareas. Estos modelos, que son programas diseñados para entender y generar lenguaje humano, se están probando para ver si pueden hacer buenos planes basados en metas específicas.
¿Qué se Está Probando?
El enfoque está en si estos modelos pueden tomar un objetivo y proponer advertencias y consejos útiles sin necesitar pasos o información extra. Esto ayuda a ver si los modelos tienen suficiente conocimiento de fondo para crear un plan solo con conocer el objetivo.
Hallazgos Clave
En las pruebas, los modelos más pequeños que están entrenados especialmente para esta tarea a menudo funcionaron mejor que los modelos generales más grandes. Sin embargo, ninguno de los modelos logró igualar el rendimiento humano.
Se encontraron algunos puntos interesantes durante las pruebas. Por ejemplo, diferentes modelos reaccionaron de maneras distintas cuando faltaban palabras clave. Además, ciertos modelos tuvieron más dificultades con objetivos que eran físicos o abstractos. Esta investigación podría ayudar a crear mejores modelos en el futuro.
Disponibilidad
Los recursos y datos de este proyecto están abiertos para que otros los usen y exploren, incentivando más investigación en el campo.