Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Finanzas Cuantitativas # Finanzas computacionales # Gestión de riesgos

Aprendizaje automático y predicciones de precios de acciones

Un estudio sobre el uso de aprendizaje automático para predecir precios de acciones de alta frecuencia.

Akash Deep, Chris Monico, Abootaleb Shirvani, Svetlozar Rachev, Frank J. Fabozzi

― 8 minilectura


Predicciones de acciones Predicciones de acciones con aprendizaje automático precios de acciones usando IA. Examinando los desafíos de predecir
Tabla de contenidos

Predecir precios de acciones es como intentar leer hojas de té mientras montas una montaña rusa-difícil, sorprendente y a menudo confuso. El mercado de valores está lleno de altibajos, ruido y volatilidad, lo que hace que las predicciones precisas sean una tarea complicada. Últimamente, el trading de alta frecuencia (HFT) se ha vuelto popular, donde las operaciones suceden en solo milisegundos, añadiendo aún más complejidad al juego. En este ambiente, tener modelos sólidos en tiempo real que puedan adaptarse a cambios rápidos es crucial.

El aprendizaje automático (ML) ha tomado protagonismo, prometiendo ayudar a identificar patrones ocultos en datos históricos. Técnicas como los Bosques Aleatorios y las máquinas de soporte vectorial se han utilizado ampliamente en finanzas por su adaptabilidad. Sin embargo, para que funcionen bien, dependen de características de entrada de alta calidad, especialmente cuando se trata de escenarios de alta frecuencia. Los métodos tradicionales, como ARIMA o GARCH, a menudo luchan con los giros y vueltas intrincados de los cambios rápidos en el mercado.

Análisis Técnico y Su Rol

El análisis técnico ha estado presente por mucho tiempo, proporcionando a los traders herramientas para encontrar tendencias en datos de precio y volumen. Los traders usan Indicadores Técnicos-piensa en ellos como un anillo de humor para acciones-para medir si es un buen momento para comprar o vender. Los indicadores populares incluyen bandas de Bollinger y medias móviles, que ayudan a los traders a detectar posibles reversos de precios. Sin embargo, en el mundo acelerado del trading de alta frecuencia, estos indicadores a veces pueden llevar a falsas alarmas debido al ruido abrumador del mercado.

Se ha propuesto combinar indicadores técnicos con modelos de aprendizaje automático para superar estos desafíos, pero mucho del trabajo existente se ha enfocado en datos diarios u horarios, dejando el análisis a nivel de minutos relativamente inexplorado.

Evaluación de Modelos de Aprendizaje Automático

Cuando se trata de evaluar modelos financieros de ML, métricas típicas como el error cuadrático medio (RMSE) pueden no ser suficientes. Estas medidas a menudo pasan por alto el riesgo asociado con el trading. Métricas avanzadas de riesgo, como el ratio de Rachev, se centran en el equilibrio entre ganancias y pérdidas, lo cual es vital para los traders ya que las condiciones del mercado pueden cambiar rápidamente.

Este estudio analiza el rendimiento de modelos de regresión de bosque aleatorio mejorados con indicadores técnicos para predecir precios de acciones de alta frecuencia. A diferencia de muchos estudios anteriores, este se sumerge en datos a nivel de minutos, enfocándose tanto en la precisión predictiva como en la gestión del riesgo durante los movimientos salvajes del mercado.

Recolección y Procesamiento de Datos

Reunir datos para este análisis involucró datos históricos de acciones a nivel de minutos para SPY (el ETF del S&P 500) durante un período específico. Este conjunto de datos incluye detalles esenciales como precios de apertura, cierre, máximo y mínimo. Incluso añadimos el rendimiento de los bonos del Tesoro de EE. UU. a 10 años para ayudar a evaluar rendimientos libres de riesgo.

Para dar sentido a los datos de precios y reducir sesgos, calculamos rendimientos logarítmicos para capturar cambios porcentuales. Filtramos el conjunto de datos para centrarnos en las horas de trading regulares, asegurando que evitáramos los tiempos tranquilos cuando el volumen de trading es bajo.

Resumen de Indicadores Técnicos

Se eligió una variedad de indicadores técnicos para este análisis, cada uno seleccionado por su capacidad única para ayudar a predecir movimientos en los precios de las acciones. Por ejemplo, la Media Móvil Exponencial (EMA) responde rápidamente a cambios recientes en los precios, mientras que las Bandas de Bollinger rastrean la volatilidad.

Aquí tienes un dato curioso: las Bandas de Bollinger son como bandas elásticas alrededor de los precios, estirándose cuando el mercado se vuelve salvaje y ajustándose cuando las cosas se calman. Otros indicadores, como el Índice de Canal de Productos (CCI) y el Nube de Ichimoku, también se incluyeron para añadir profundidad a nuestro análisis.

Selección de Modelo de Aprendizaje Automático

Para nuestro modelo de aprendizaje automático, elegimos el regresor de bosque aleatorio (RFR). Este método funciona creando múltiples árboles de decisión, cada uno basado en subconjuntos de datos aleatorios, y luego promediando las predicciones. Esto ayuda a reducir las posibilidades de sobreajuste, donde un modelo aprende patrones que son demasiado específicos para los datos de entrenamiento y no logra generalizar a nuevos datos.

Marco de Simulación de Trading

Establecimos una estrategia de trading simulada utilizando señales de compra, venta y mantener generadas por el modelo de bosque aleatorio. Comenzando con un portafolio de $10,000, la estrategia implicaba comprar acciones cuando se predecía un movimiento de precio al alza y vender cuando se esperaba un movimiento a la baja.

Para hacer la simulación realista, añadimos una restricción de rotación para representar costos de transacción y límites de liquidez.

Métricas de Rendimiento

Para evaluar el rendimiento de nuestros modelos, utilizamos varias métricas. RMSE y el error absoluto medio (MAE) nos ayudaron a evaluar la precisión predictiva, mientras que el Ratio de Sharpe y el Ratio de Sortino nos dieron información sobre el rendimiento ajustado al riesgo.

Aunque nos encantan los números, es importante recordar que un buen modelo no debería ser solo sobre obtener retornos llamativos, sino también sobre gestionar el riesgo de forma inteligente.

Resultados y Observaciones

Hallazgos Generales

Los resultados revelaron que aunque los modelos con indicadores técnicos tenían algunas ventajas en la gestión del riesgo, luchaban por generar retornos consistentes. Para la mayoría de los modelos, el rendimiento en entrenamiento fue significativamente mejor que en prueba, sugiriendo un serio problema de sobreajuste.

En el mundo real, los modelos de trading necesitan entregar retornos a lo largo del tiempo. Desafortunadamente, nuestro estudio encontró que estas estrategias de trading algorítmico a menudo se quedaban atrás de una simple estrategia de compra y mantener, que, en retrospectiva, podría haber sonado aburrida pero termina siendo bastante efectiva.

El Rol de los Indicadores Técnicos

Al analizar la contribución de los indicadores técnicos, los hallazgos mostraron que los datos de precios primarios seguían teniendo más peso en las predicciones que los propios indicadores. Esto llevó a preguntas sobre la utilidad real de los indicadores técnicos en entornos de trading de alta frecuencia, especialmente cuando el ruido del mercado puede eclipsar sus señales.

Gestión del Riesgo

A pesar de sus limitaciones en la generación de retornos, los modelos mostraron potencial en la gestión del riesgo. Algunos modelos se desempeñaron mejor manejando el riesgo a la baja en comparación con otros. El ratio de Sharpe indicó que, aunque los modelos no sobresalían en ganancias, tenían un talento para gestionar pérdidas potenciales.

Perspectivas Comportamentales y Eficiencia del Mercado

Curiosamente, los hallazgos también cuestionan la forma débil de la Hipótesis de Eficiencia del Mercado (EMH), que sugiere que los precios históricos no pueden predecir movimientos futuros. Mientras que nuestros modelos funcionaron bien cuando fueron entrenados con datos históricos, lucharon por aplicar este conocimiento a nuevos datos no vistos.

Esto podría sugerir que hay ineficiencias temporales en el mercado, especialmente en períodos de alta volatilidad, abriendo la puerta a traders dispuestos a asumir algunos riesgos calculados.

Conclusión y Consideraciones Futuras

Este estudio arroja luz sobre el complejo mundo de la predicción de precios de acciones utilizando aprendizaje automático e indicadores técnicos. Aunque encontramos algunos insights valiosos sobre la gestión del riesgo, los desafíos de generar retornos consistentes y lidiar con el sobreajuste no pueden ser ignorados.

Mirando hacia adelante, hay oportunidades emocionantes por explorar. La investigación futura podría experimentar con diferentes clases de activos o integrar fuentes de datos alternativas que puedan mejorar la precisión predictiva. Usar técnicas avanzadas de aprendizaje automático también podría ayudar a capturar mejor las dependencias secuenciales en datos de alta frecuencia.

Al final, aunque predecir precios de acciones puede sentirse como intentar domar un caballo salvaje, el viaje ofrece muchas oportunidades para aprender y crecer-solo recuerda agarrarte fuerte.

Fuente original

Título: Assessing the Impact of Technical Indicators on Machine Learning Models for Stock Price Prediction

Resumen: This study evaluates the performance of random forest regression models enhanced with technical indicators for high-frequency stock price prediction. Using minute-level SPY data, we assessed 13 models that incorporate technical indicators such as Bollinger bands, exponential moving average, and Fibonacci retracement. While these models improved risk-adjusted performance metrics, they struggled with out-of-sample generalization, highlighting significant overfitting challenges. Feature importance analysis revealed that primary price-based features consistently outperformed technical indicators, suggesting their limited utility in high-frequency trading contexts. These findings challenge the weak form of the efficient market hypothesis, identifying short-lived inefficiencies during volatile periods but its limited persistence across market regimes. The study emphasizes the need for selective feature engineering, adaptive modeling, and a stronger focus on risk-adjusted performance metrics to navigate the complexities of high-frequency trading environments.

Autores: Akash Deep, Chris Monico, Abootaleb Shirvani, Svetlozar Rachev, Frank J. Fabozzi

Última actualización: Dec 19, 2024

Idioma: English

Fuente URL: https://arxiv.org/abs/2412.15448

Fuente PDF: https://arxiv.org/pdf/2412.15448

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares