Últimos artículos para Procesos de Decisión de Markov

Lógica en Informática Nuevo método para analizar sistemas inciertos

Una nueva técnica mejora las verificaciones de seguridad en sistemas aleatorios como robots y vehículos.

2025-09-28T12:20:24+00:00 ― 7 minilectura

Aprendizaje automático Una Nueva Mirada al Aprendizaje por Refuerzo Inverso

Los investigadores proponen un enfoque bayesiano para mejorar la toma de decisiones en agentes inteligentes.

2025-09-26T14:23:18+00:00 ― 7 minilectura

Robótica Entrenando robots para jugar tenis de mesa como humanos

Investigadores desarrollan robots que aprenden a jugar al ping pong a través de demostraciones similares a las humanas.

2025-09-25T19:57:18+00:00 ― 8 minilectura

Optimización y control Procesos de Decisión de Markov Continuos en la Toma de Decisiones

Una inmersión en MDPs continuos y sus aplicaciones en la toma de decisiones y el aprendizaje por refuerzo.

2025-09-25T06:59:55+00:00 ― 7 minilectura

Optimización y control Navegando la Toma de Decisiones con Procesos de Markov Robustos Distribucionalmente

Aprende cómo los MDPs robustos manejan la incertidumbre en los marcos de toma de decisiones.

2025-09-22T23:30:24+00:00 ― 6 minilectura

Aprendizaje automático Mejorando el flujo de tráfico con vehículos autónomos

Un nuevo sistema mejora la toma de decisiones de los AV durante la construcción de carreteras.

2025-09-22T03:52:12+00:00 ― 6 minilectura

Robótica Mejorando el Manejo de Objetos por Robots a Través de Planificación Avanzada

Un nuevo método mejora la capacidad de los robots para agarrar y mover objetos de manera segura.

2025-09-21T18:23:24+00:00 ― 9 minilectura

Aprendizaje automático Avances en Aprendizaje por Refuerzo con Múltiples Operadores de Bellman

Explorando el multi-aprendizaje y su impacto en la estabilidad y rendimiento del aprendizaje por refuerzo.

2025-09-20T17:46:06+00:00 ― 9 minilectura

Aprendizaje automático Examinando la complejidad de muestras en algoritmos NPMD

Este estudio destaca la complejidad de muestra de los algoritmos de Descenso Espejo de Política Neuronal en aprendizaje profundo.

2025-09-18T18:51:28+00:00 ― 6 minilectura

Inteligencia artificial Asegurando la seguridad de los agentes de IA en diferentes entornos

Una mirada a cómo los agentes de IA pueden mantenerse seguros en diferentes entornos.

2025-09-18T14:25:06+00:00 ― 7 minilectura

Lógica en Informática Analizando Procesos con Observaciones Imprecisas

Un método para calcular probabilidades en sistemas con tiempos de observación inciertos.

2025-09-17T10:22:24+00:00 ― 7 minilectura

Probabilidad Aplicando Procesos de Decisión de Markov en la Gestión Forestal

Usando MDPs para optimizar estrategias de aclarado para un crecimiento forestal sostenible.

2025-09-14T19:19:07+00:00 ― 7 minilectura

Computación y lenguaje La integración del aprendizaje por refuerzo y los modelos de lenguaje grandes

Explorando la sinergia entre RL y LLMs para mejorar las aplicaciones de IA.

2025-09-12T05:17:24+00:00 ― 8 minilectura

Aprendizaje automático Avances en Aprendizaje por Refuerzo a través de Procesos de Decisión de Markov Suaves

Nuevos algoritmos abordan los desafíos en espacios de acción y estado continuos en el Aprendizaje por Refuerzo.

2025-09-10T14:42:42+00:00 ― 8 minilectura

Aprendizaje automático Navegando Procesos de Decisión de Markov de Estado Infinito

Una mirada a los MDPs de estado infinito y su papel en el aprendizaje por refuerzo.

2025-09-10T09:50:24+00:00 ― 8 minilectura

Inteligencia artificial Avanzando la Inferencia Contrafactual en la Toma de Decisiones

Este trabajo mejora la inferencia contrafactual para tomar mejores decisiones en el cuidado de la salud.

2025-09-08T14:15:30+00:00 ― 9 minilectura

Matemáticas discretas Límites de rendimiento de los métodos clásicos de optimización

Examinando los peores escenarios en el algoritmo simplex y la iteración de políticas.

2025-09-06T02:27:33+00:00 ― 7 minilectura

Inteligencia artificial Diseñando controladores efectivos para entornos complejos

Un método que usa aprendizaje por refuerzo profundo y síntesis reactiva para el diseño de controladores.

2025-09-05T12:07:48+00:00 ― 5 minilectura

Inteligencia artificial Optimización de la planificación de rovers para misiones espaciales

Un nuevo método mejora la planificación de rovers en misiones científicas, asegurando eficiencia y fiabilidad.

2025-09-03T23:31:36+00:00 ― 7 minilectura

Aprendizaje automático Avances en Algoritmos de Aprendizaje Libre de Escala

Nuevos algoritmos abordan desafíos en MDPs adversariales sin necesitar conocimiento previo de pérdidas.

2025-09-02T12:30:12+00:00 ― 8 minilectura

Aprendizaje automático Evaluando Políticas con Métodos Off-Policy

Una mirada a las técnicas de evaluación fuera de política y su relevancia en la toma de decisiones.

2025-09-01T13:48:28+00:00 ― 7 minilectura

Aprendizaje automático Mejorando la seguridad en el control de naves espaciales autónomas

Un estudio sobre Aprendizaje por Refuerzo Profundo Blindado para la autonomía segura de naves espaciales.

2025-08-31T07:50:12+00:00 ― 8 minilectura

Aprendizaje automático Soft Q-Learning: Equilibrando la Exploración en la Toma de Decisiones

Examinando el soft Q-learning para una toma de decisiones efectiva en entornos inciertos.

2025-08-30T19:19:42+00:00 ― 7 minilectura

Aprendizaje automático Avances en la Toma de Decisiones de Camiones Autónomos

Este artículo cubre el desarrollo de sistemas inteligentes para camiones autónomos.

2025-08-30T10:30:24+00:00 ― 7 minilectura

Sistemas y Control Mejorando la Toma de Decisiones en Sistemas Autónomos

Mezclando HMDP y MPC para operaciones de vehículos autónomos más seguras.

2025-08-30T06:57:45+00:00 ― 8 minilectura

Aprendizaje automático Una visión general de los métodos de aprendizaje por refuerzo

Aprende cómo las computadoras toman decisiones a través de técnicas y procesos de Aprendizaje por Refuerzo.

2025-08-28T19:24:06+00:00 ― 7 minilectura

Robótica Un Nuevo Método para Navegación Segura en Vehículos Autónomos

Este trabajo presenta un marco para mejorar la seguridad en la navegación de vehículos autónomos.

2025-08-26T15:31:30+00:00 ― 9 minilectura

Robótica Robots y Preferencias Humanas: Un Nuevo Enfoque

Este artículo habla sobre cómo los robots pueden entender mejor las preferencias humanas en la ejecución de tareas.

2025-08-25T17:24:18+00:00 ― 8 minilectura

Ingeniería del software Mejorando el Comportamiento del Software con Requisitos de "Debes Terminar"

Este documento habla sobre cómo mejorar el comportamiento del software a través de requisitos de vivacidad.

2025-08-23T05:45:36+00:00 ― 6 minilectura

Optimización y control Evaluando el rendimiento de políticas en MDPs aproximados

Este artículo examina qué tan bien funcionan las políticas a partir de modelos aproximados en entornos complejos.

2025-08-22T04:09:53+00:00 ― 6 minilectura

Aprendizaje automático Árboles de Decisión en Tiempo Real Usando Métodos de Monte Carlo

Presentando un algoritmo óptimo para árboles de decisión en datos en streaming.

2025-08-20T21:00:42+00:00 ― 8 minilectura

Inteligencia artificial Avances en la Toma de Decisiones con BTS y DENTS

Nuevos algoritmos mejoran la toma de decisiones en tareas de planificación de IA.

2025-08-20T10:36:36+00:00 ― 9 minilectura

Informática y Teoría de Juegos Gestionando la energía y las recompensas en la toma de decisiones

Explorando estrategias para optimizar los niveles de energía y recompensas en Procesos de Decisión de Markov.

2025-08-17T14:40:12+00:00 ― 7 minilectura

Robótica Abordando el problema de la mano temblorosa en robots

Este estudio se centra en cómo los robots pueden planear a pesar de cometer errores.

2025-08-16T20:37:54+00:00 ― 8 minilectura

Aprendizaje automático Simplificando el Análisis de Convergencia en el Aprendizaje por Refuerzo

Esta investigación simplifica la prueba de convergencia para el aprendizaje TD con aproximación de funciones lineales.

2025-08-16T02:13:31+00:00 ― 8 minilectura

Aprendizaje automático Haciendo que la dosificación de Warfarina sea más comprensible

Un nuevo enfoque mejora la claridad en la dosificación de warfarina y la atención al paciente.

2025-08-16T02:11:54+00:00 ― 9 minilectura

Sistemas y Control Avanzando en la seguridad de los sistemas de radar

La tecnología de radar adaptativo mejora la seguridad contra adversarios mientras mantiene el rendimiento.

2025-08-16T01:15:35+00:00 ― 8 minilectura

Aprendizaje automático Avances en Aprendizaje por Refuerzo Multi-Objetivo

Un nuevo enfoque de actor-crítico enfrenta desafíos multi-objetivo en el aprendizaje por refuerzo.

2025-08-13T17:27:00+00:00 ― 11 minilectura

Inteligencia artificial Mejorando la FMEA en Salud con Automatización

Un nuevo marco utiliza tecnología para simplificar el análisis de fallos en la atención médica.

2025-08-13T09:09:18+00:00 ― 7 minilectura

Criptografía y seguridad Analizando la minería egoísta en sistemas de blockchain

Una mirada más cercana a los ataques de minería egoísta y su impacto en la seguridad de la blockchain.

2025-08-13T01:31:06+00:00 ― 9 minilectura