La IA predice eventos: Preguntas directas vs. Narración de historias
Un estudio revela cómo los prompts de narración mejoran las predicciones de la IA en comparación con preguntas directas.
― 7 minilectura
Tabla de contenidos
La inteligencia artificial (IA) está cambiando rápidamente la forma en que vemos varias tareas, incluyendo la Predicción. Un tema de interés es si la IA puede adivinar con precisión eventos futuros, especialmente cuando se trata de acontecimientos significativos como los Premios de la Academia o tendencias económicas. Este artículo explora el potencial de un modelo de IA específico llamado ChatGPT, particularmente las versiones 3.5 y 4, para predecir eventos que ocurrieron después de su última actualización.
Antecedentes sobre ChatGPT
ChatGPT es un producto desarrollado por OpenAI, construido sobre una estructura conocida como transformador. Este modelo transformador puede entender el lenguaje y generar respuestas que suenan naturales. ChatGPT ha sido entrenado con una gran cantidad de texto de internet, libros y artículos, lo que le permite comprender una amplia gama de temas y contextos. Sin embargo, sus datos de entrenamiento se cortan en septiembre de 2021, lo que significa que no conoce eventos que ocurran después de esa fecha. Esta limitación es vital para entender qué tan bien puede predecir eventos posteriores.
La Idea Básica
Este estudio investiga si ChatGPT puede hacer predicciones precisas sobre eventos que sucedieron en 2022. Los investigadores se centraron en dos métodos diferentes de preguntar a la IA sobre estas predicciones: preguntas directas y sugerencias de narración. Al comparar ambos enfoques, querían determinar qué método resultaba en mejores predicciones.
Preguntas directas vs. Sugerencias de narración
Preguntas directas: Este método le pide a ChatGPT que prediga eventos futuros específicos de manera directa. Por ejemplo, se podría preguntar, "¿Quién ganará el Mejor Actor en los Oscars 2022?" Este enfoque es típico, pero puede que no aproveche efectivamente las fortalezas del modelo.
Sugerencias de narración: Este método consiste en pedirle a ChatGPT que cuente una historia ficticia ambientada en el futuro, donde los eventos ya han sucedido. Podría ser algo como, "Cuenta una historia sobre una familia viendo los Oscars y revela quién ganó el Mejor Actor." Este estilo anima a la IA a involucrarse de manera más creativa y a utilizar sus datos de entrenamiento de una forma diferente.
Probando las predicciones
Para ver qué tan bien se desempeñó ChatGPT bajo estos dos métodos, los investigadores probaron tanto ChatGPT-3.5 como ChatGPT-4. Analizaron varios eventos que tuvieron lugar en 2022, centrándose en dos áreas principales: los Premios de la Academia y Indicadores Económicos como tasas de desempleo e inflación.
Los Premios de la Academia
Los investigadores utilizaron tanto preguntas directas como sugerencias de narración para ver qué método usaría ChatGPT para predecir a los ganadores de los principales premios de cine en 2022. Específicamente miraron categorías como Mejor Actor, Mejor Actriz y Mejor Película.
Mejor Actor de Reparto: El verdadero ganador fue Troy Kotsur. Cuando se le preguntó directamente, ChatGPT-3.5 predijo correctamente solo el 1% de las veces, principalmente se negó a responder. En contraste, cuando se usó la narración, las predicciones mejoraron significativamente, especialmente con ChatGPT-4, que predijo a Kotsur correctamente cada vez.
Mejor Actor: El ganador fue Will Smith. ChatGPT-3.5 hizo la predicción correcta alrededor del 17% de las veces con preguntas directas. Curiosamente, cuando se usaron sugerencias de narración, acertó el 80% del tiempo. ChatGPT-4 mostró un rendimiento aún mejor, prediciendo la victoria de Smith el 97% del tiempo.
Mejor Actriz de Reparto: Ariana DeBose fue la ganadora. Mientras que ChatGPT-3.5 la predijo correctamente el 34% de las veces con preguntas directas, mejoró al 73% con sugerencias de narración. ChatGPT-4 fue incluso mejor, prediciendo la victoria de DeBose el 99% del tiempo.
Mejor Actriz: Jessica Chastain se llevó el premio. ChatGPT-3.5 tuvo problemas con preguntas directas, prediciéndola solo el 13% de las veces, mientras que la narración mejoró eso al 42%. ChatGPT-4 también se desempeñó mejor que el 40% pero aún no pudo predecir efectivamente la victoria de Chastain.
Mejor Película: La película ganadora fue Coda. Ninguno de los modelos identificó predeciblemente esta película, con ChatGPT-3.5 sin elegirla en ningún estilo de pregunta. ChatGPT-4 fue un poco mejor con Coda, pero aún así falló en predecirla la mayor parte del tiempo.
Predicciones Económicas
La siguiente parte del estudio analizó indicadores económicos. Los investigadores querían ver si ChatGPT podía predecir con precisión las tasas de desempleo e inflación durante los meses previos a septiembre de 2022.
Tasas de Desempleo: Las preguntas directas no lograron obtener predicciones. Sin embargo, cuando se le preguntó que contara una historia sobre un economista discutiendo las tasas de desempleo, ChatGPT-3.5 tuvo dificultades, mientras que ChatGPT-4 tuvo un mejor desempeño pero aún no acertó con todas las tasas objetivo.
Tasas de Inflación: Similar a las tasas de desempleo, las preguntas directas no generaron predicciones. Cuando se le dijo a través de sugerencias de narración con un economista, ChatGPT-3.5 produjo resultados insatisfactorios. ChatGPT-4 tuvo una variedad de respuestas más ajustada pero aún no predijo con alta precisión durante todo el año.
Cómo la narración ayudó
Los resultados mostraron una tendencia clara: las sugerencias de narración ofrecieron una ventaja significativa sobre las preguntas directas. Esto podría deberse a cómo la estructura subyacente de la IA utiliza sus habilidades de generación de lenguaje de manera creativa al participar en la elaboración de historias. Al enmarcar las predicciones dentro de una narrativa, la IA podía utilizar sus datos de entrenamiento de manera más efectiva, lo que condujo a mejores resultados.
¿Por qué es esto importante?
Los hallazgos sugieren que modelos de lenguaje grandes como ChatGPT pueden ser potencialmente útiles para tareas de predicción, particularmente de maneras creativas. Esto es crucial no solo para el entretenimiento, como predecir ganadores de premios, sino también para aplicaciones serias como la previsión económica. A medida que la sociedad sigue explorando las capacidades de la IA, entender cómo interactuar con los modelos a través de preguntas bien pensadas podría llevar a un mejor uso con el tiempo.
Consideraciones Futuras
A medida que las tecnologías de IA se desarrollan más, la importancia del diseño de preguntas no puede subestimarse. La forma en que hacemos preguntas puede influir significativamente en las respuestas que recibimos. Los investigadores sugieren que este método podría extenderse a otros campos donde la predicción es esencial, como la previsión meteorológica, las predicciones del mercado de valores e incluso la salud pública.
Además, resalta un desafío específico para garantizar el uso ético de la IA. Si bien las sugerencias de narración muestran promesas, también traen riesgos de malinterpretación, especialmente si las personas comienzan a confiar en las predicciones de la IA para decisiones significativas sin el contexto o el aporte experto necesario.
Conclusión
ChatGPT puede predecir eventos mejor cuando se le pide que cuente historias en lugar de dar predicciones directas. Este enfoque no solo aprovecha el potencial creativo de la IA, sino que también revela su base de conocimientos existente de manera más efectiva. A medida que la IA continúa evolucionando, entender cómo aprovechar estos sistemas a través de preguntas innovadoras puede desbloquear capacidades aún mayores en varios dominios.
Al revelar las fortalezas ocultas de los modelos de lenguaje grandes en tareas de predicción, este estudio abre puertas para sus futuras aplicaciones. A medida que seguimos interactuando con la IA, es esencial ser conscientes de cómo enmarcamos nuestras preguntas y de lo que esperamos de estas herramientas poderosas.
Título: Can Base ChatGPT be Used for Forecasting without Additional Optimization?
Resumen: This study investigates whether OpenAI's ChatGPT-3.5 and ChatGPT-4 can forecast future events. To evaluate the accuracy of the predictions, we take advantage of the fact that the training data at the time of our experiments (mid 2023) stopped at September 2021, and ask about events that happened in 2022. We employed two prompting strategies: direct prediction and what we call future narratives which ask ChatGPT to tell fictional stories set in the future with characters retelling events that happened in the past, but after ChatGPT's training data had been collected. We prompted ChatGPT to engage in storytelling, particularly within economic contexts. After analyzing 100 trials, we find that future narrative prompts significantly enhanced ChatGPT-4's forecasting accuracy. This was especially evident in its predictions of major Academy Award winners as well as economic trends, the latter inferred from scenarios where the model impersonated public figures like the Federal Reserve Chair, Jerome Powell. As a falsification exercise, we repeated our experiments in May 2024 at which time the models included more recent training data. ChatGPT-4's accuracy significantly improved when the training window included the events being prompted for, achieving 100% accuracy in many instances. The poorer accuracy for events outside of the training window suggests that in the 2023 prediction experiments, ChatGPT-4 was forming predictions based solely on its training data. Narrative prompting also consistently outperformed direct prompting. These findings indicate that narrative prompts leverage the models' capacity for hallucinatory narrative construction, facilitating more effective data synthesis and extrapolation than straightforward predictions. Our research reveals new aspects of LLMs' predictive capabilities and suggests potential future applications in analytical contexts.
Autores: Van Pham, Scott Cunningham
Última actualización: 2024-07-04 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2404.07396
Fuente PDF: https://arxiv.org/pdf/2404.07396
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.