Últimos artículos para Métricas

Computación y lenguaje Evaluando la NLG con el marco AdvEval

AdvEval expone las debilidades en las métricas de evaluación de Generación de Lenguaje Natural.

2025-08-08T07:29:42+00:00 ― 8 minilectura

Informática y sociedad Usando Aprendizaje Automático para Medir la Pobreza en Filipinas

Este estudio evalúa métodos de aprendizaje automático para medir con precisión los niveles de pobreza.

2025-08-06T01:54:24+00:00 ― 7 minilectura

Geometría computacional Construyendo espaciadores tolerantes a fallos en teoría de grafos

Aprende cómo los spanners pueden mantener la precisión de distancia a pesar de fallos en los bordes.

2025-08-05T17:28:48+00:00 ― 6 minilectura

Aprendizaje automático Un Nuevo Enfoque para Medir Modelos Generativos

Este estudio presenta una mejor forma de evaluar el rendimiento de los modelos generativos.

2025-08-05T05:56:04+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando en la Respuesta a Preguntas Visuales con Técnicas de Juego Autónomo

Nuevos métodos mejoran los modelos de VQA usando los datos de entrenamiento existentes de manera eficiente.

2025-08-04T13:34:00+00:00 ― 6 minilectura

Interacción Persona-Ordenador Mejorando las Conversaciones de Datos con Nueva Aplicación

Una nueva app enriquece las charlas sobre métricas para tener mejores ideas.

2025-08-02T01:15:48+00:00 ― 7 minilectura

Recuperación de información Equidad en Sistemas de Recomendación: Abordando los Sesgos

Este artículo habla sobre la medición de la equidad en los sistemas de recomendación y propone métodos de muestreo.

2025-08-01T01:25:54+00:00 ― 8 minilectura

Aprendizaje automático Midiendo la Varianza en los Benchmarks de Modelos de Lenguaje

Este artículo examina métodos para evaluar la variabilidad en los criterios de evaluación de modelos de lenguaje.

2025-07-28T23:26:06+00:00 ― 9 minilectura

Probabilidad Perspectivas sobre el paisaje dirigido de la geometría aleatoria

Explora el paisaje dirigido y sus implicaciones en probabilidad y estadística.

2025-07-28T14:09:36+00:00 ― 4 minilectura

Interacción Persona-Ordenador Evaluando Asistentes de IA: Desafíos y Soluciones

Este artículo examina la evaluación de asistentes de IA y propone métodos para mejorarlos.

2025-07-28T10:31:54+00:00 ― 9 minilectura

Física de altas energías - Fenomenología Nuevas métricas en física de colisionadores usando el espacio de fases

Un enfoque nuevo para analizar colisiones de partículas y obtener nuevas perspectivas sobre la física.

2025-07-28T00:48:54+00:00 ― 7 minilectura

Rendimiento CEBench: Un Enfoque Equilibrado para Evaluar LLMs

CEBench ayuda a las empresas y a los investigadores a evaluar LLMs mientras manejan costos y rendimiento.

2025-07-26T00:43:48+00:00 ― 7 minilectura

Computación y lenguaje Evaluando Contranarrativas Contra el Discurso de Odio

Un nuevo método mejora cómo evaluamos las contranarrativas al discurso de odio.

2025-07-25T20:15:12+00:00 ― 7 minilectura

Aprendizaje automático El impacto de la fidelidad en las redes neuronales gráficas

Explorando la necesidad de explicaciones claras en Redes Neuronales Gráficas.

2025-07-25T19:35:42+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones El Papel Crítico de la Investigación sobre Hielos

El análisis de datos de las capas de hielo es clave para luchar contra el cambio climático y el aumento del nivel del mar.

2025-07-23T18:21:06+00:00 ― 6 minilectura

Aprendizaje automático La creciente importancia de la calidad de los datos en el aprendizaje automático

La calidad de los datos es crucial para modelos de aprendizaje automático efectivos en diversos sectores.

2025-07-23T15:58:54+00:00 ― 12 minilectura

Aprendizaje automático Mejorando la Detección de Problemas en Microservicios con CHASE

CHASE mejora el análisis de la causa raíz en microservicios utilizando diversos métodos de datos.

2025-07-22T17:28:00+00:00 ― 10 minilectura

Inteligencia artificial Presentando CRAB: Un Nuevo Estándar para Modelos de Lenguaje

CRAB mejora las pruebas para modelos de lenguaje en entornos del mundo real.

2025-07-21T18:41:18+00:00 ― 8 minilectura

Relatividad general y cosmología cuántica Ondas Gravitacionales y Gravedad Modificada: Nuevas Perspectivas

Explorando cómo METRICS nos ayuda a estudiar agujeros negros y ondas gravitacionales.

2025-07-20T16:27:06+00:00 ― 5 minilectura

Computación y lenguaje Evaluando la Calidad de la Traducción Automática a lo Largo del Tiempo

Un estudio sobre el rendimiento de varias métricas para traducciones automáticas.

2025-07-20T10:17:54+00:00 ― 8 minilectura

Computación y lenguaje Abordando las alucinaciones en los modelos de lenguaje

Una herramienta para identificar respuestas engañosas de modelos de lenguaje grandes.

2025-07-19T14:25:00+00:00 ― 7 minilectura

Geometría diferencial Entendiendo los Rayos Geodésicos y Sus Propiedades

Explora el papel de los rayos geodésicos en el estudio de espacios complejos.

2025-07-18T11:47:08+00:00 ― 6 minilectura

Inteligencia artificial Mejorando la integración de grafo de conocimiento a través de alineación de entidades

Un método para mejorar la integración de grafos de conocimiento usando alineación y reconocimiento de tipos de entidad.

2025-07-17T21:04:24+00:00 ― 8 minilectura

Endocrinología Diametrics: Simplificando el Análisis de Monitoreo Continuo de Glucosa

Una herramienta fácil de usar para analizar datos de CGM en la gestión de la diabetes.

2025-07-15T22:29:00+00:00 ― 8 minilectura

Computación y lenguaje Repensando los métodos de evaluación para los LLMs

Una nueva forma de evaluar modelos de lenguaje grandes para obtener mejores ideas sobre su rendimiento.

2025-07-15T16:32:18+00:00 ― 6 minilectura

Ingeniería del software Predicción de Bugs en Tiempo Real en Sistemas Multilenguaje

Un estudio desarrolla modelos para predecir errores de software en tiempo real para sistemas complejos.

2025-07-13T09:14:18+00:00 ― 9 minilectura

Teoría de la física de altas energías Avanzando el Aprendizaje Automático en la Geometría Calabi-Yau

Los investigadores mejoran las aproximaciones métricas en las variedades de Calabi-Yau usando técnicas de aprendizaje automático.

2025-07-11T10:02:06+00:00 ― 6 minilectura

Arquitectura de hardware Desafíos en el Diseño de Hardware Específico de Dominio

Una visión general de los temas clave en el diseño de hardware de computación especializado.

2025-07-11T02:05:45+00:00 ― 8 minilectura

Metodología Un nuevo enfoque para las pruebas continuas en experimentos en línea

Te presento YEAST, un método flexible para monitorear experimentos en línea de manera efectiva.

2025-07-10T19:57:20+00:00 ― 7 minilectura

Ingeniería del software Análisis de Causa Raíz en Microservicios: Desafíos y Técnicas

Explora métodos de análisis de causa raíz para microservicios y su impacto en el rendimiento.

2025-07-08T15:28:42+00:00 ― 10 minilectura

Ingeniería del software Evaluando la evolución de la arquitectura de microservicios

Un nuevo marco para rastrear la evolución de microservicios usando métricas.

2025-07-08T12:50:42+00:00 ― 8 minilectura

Ingeniería del software Refactorizando Código: Perspectivas y Consejos para Desarrolladores

Este estudio examina las motivaciones de los desarrolladores y las métricas para un refactoring de código efectivo.

2025-07-07T02:20:54+00:00 ― 8 minilectura

Aprendizaje automático Comgra: Una herramienta para el análisis de redes neuronales

Comgra ofrece herramientas intuitivas para gestionar y analizar redes neuronales de manera efectiva.

2025-07-04T08:54:36+00:00 ― 6 minilectura

Computación y lenguaje Evaluando LLMs en la eficiencia de investigación ESG

Un estudio sobre la efectividad de los LLMs en la revisión de literatura ESG y el rendimiento financiero.

2025-07-03T12:06:24+00:00 ― 7 minilectura

Geometría diferencial Avances en Cálculo Geodésico en el Manifoldo de Stiefel

Nuevos métodos para calcular geodésicas en el manifold de Stiefel mejoran la eficiencia del algoritmo.

2025-06-30T17:19:40+00:00 ― 9 minilectura

Geometría computacional Reevaluando las métricas de estrés en la visualización de gráficos

Nuevos métodos buscan mejorar la precisión en la evaluación de la disposición de gráficos.

2025-06-30T14:03:36+00:00 ― 10 minilectura

Aprendizaje automático Predicción de Anomalías: Un Nuevo Enfoque para el Análisis de Series Temporales

Un método nuevo para detectar patrones inusuales en datos de series temporales con el tiempo.

2025-06-30T08:08:06+00:00 ― 8 minilectura

Recuperación de información Taller sobre Modelos de Lenguaje Grande en la Recuperación de Información

Los investigadores discuten el impacto de los LLM en la evaluación de sistemas de recuperación de información.

2025-06-30T04:26:54+00:00 ― 7 minilectura

Ingeniería del software El impacto del contexto en las pruebas de equidad en el aprendizaje profundo

Este artículo examina cómo diferentes contextos afectan los resultados de las pruebas de equidad en la IA.

2025-06-28T23:44:42+00:00 ― 6 minilectura

Física cuántica El Intrigante Mundo de la Mecánica Cuántica No-Hermítica

Una mirada a los sistemas no hermíticos y sus comportamientos únicos en la mecánica cuántica.

2025-06-27T15:25:09+00:00 ― 5 minilectura