Un marco para entender nuestra dependencia de la IA en la toma de decisiones.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un marco para entender nuestra dependencia de la IA en la toma de decisiones.
― 7 minilectura
Este documento examina las inyecciones de prompts y sus implicaciones para los modelos de IA.
― 4 minilectura
Examinando cómo los modelos de resumen reflejan sesgos en opiniones políticas.
― 8 minilectura
Este estudio analiza cómo los LLMs pueden predecir los posibles daños de la IA.
― 9 minilectura
Examinando la amplificación de daño en modelos de texto a imagen y su impacto en la sociedad.
― 8 minilectura
Un nuevo marco ayuda a los modelos generativos a olvidar datos sensibles sin perder rendimiento.
― 9 minilectura
Este estudio investiga ataques de jailbreaking en modelos de lenguaje grandes multimodales.
― 7 minilectura
Investigando riesgos de seguridad y métodos de detección para modelos de difusión.
― 8 minilectura
Examinando cómo el aprendizaje automático perpetúa los sesgos de género y sus efectos emocionales.
― 7 minilectura
Examinando la relación entre las leyes de protección de datos y las prácticas de aprendizaje automático.
― 8 minilectura
Explorando métodos para proteger los datos personales en un mundo impulsado por la información.
― 6 minilectura
Explorando cómo la fricción puede mejorar las experiencias de usuario en IA.
― 13 minilectura
Un análisis de las cualidades y desafíos de las explicaciones de modelos de lenguaje.
― 6 minilectura
Examinando las limitaciones de los LLMs para entender y retener información temporal.
― 6 minilectura
Nuevos métodos de marca de agua mejoran la variedad de texto y la detección en contenido generado por máquinas.
― 9 minilectura
Un análisis de cómo se captura la atención y su impacto en la sociedad.
― 10 minilectura
Este artículo examina los peligros de la sintonización dañina en los modelos de lenguaje.
― 9 minilectura
Nuevos métodos aseguran los datos en la IA mientras garantizan cálculos efectivos.
― 7 minilectura
Un método para eliminar habilidades no deseadas de los modelos de lenguaje mientras se mantienen intactas las funciones esenciales.
― 7 minilectura
Un nuevo estándar busca medir y mitigar los peligros relacionados con la IA.
― 6 minilectura
Un marco para evaluar sesgos en las recomendaciones generadas por modelos de lenguaje grandes.
― 6 minilectura
Métodos para minimizar el sesgo en modelos de lenguaje grandes para resultados más justos.
― 9 minilectura
Este documento analiza el sesgo de género en los modelos de lenguaje grandes y propone métodos de medición.
― 9 minilectura
Evaluando cómo los sesgos en los modelos de lenguaje afectan las aplicaciones del mundo real.
― 7 minilectura
Un nuevo modelo crea imágenes realistas a partir de características de identidad usando aprendizaje automático.
― 6 minilectura
Explorando las características clave y los desafíos de desarrollar sistemas de IA confiables.
― 6 minilectura
Un estudio de las técnicas usadas para eludir las medidas de seguridad en los modelos de lenguaje de IA.
― 10 minilectura
Un estudio que mide el sesgo político en modelos de lenguaje grandes a través de la postura y el encuadre.
― 8 minilectura
Una mirada más cercana a los circuitos de características dispersas en los modelos de lenguaje y sus implicaciones.
― 11 minilectura
Explorando la importancia de un razonamiento comprensible en las predicciones de IA.
― 7 minilectura
Un marco para mejorar la seguridad y confiabilidad de los modelos de lenguaje grandes.
― 8 minilectura
Explorando el papel de la ética en la tecnología de traducción de idiomas.
― 6 minilectura
Examinando cómo el olvido de máquinas puede exponer datos sensibles.
― 10 minilectura
El benchmark ALERT evalúa los riesgos de seguridad en los modelos de lenguaje para mejorar sus respuestas.
― 5 minilectura
Una nueva herramienta para hacer que las imágenes sean más seguras y responsables.
― 9 minilectura
La investigación investiga los sesgos en los modelos de lenguaje turcos y sus impactos en la sociedad.
― 10 minilectura
Aprende cómo el Contexto Dirigido mejora las respuestas de los modelos de lenguaje a través del uso adaptable del contexto.
― 9 minilectura
Investigaciones recientes desafían la simplicidad de la Teoría del Neurona del Conocimiento en los modelos de lenguaje.
― 12 minilectura
La investigación aborda las preocupaciones de privacidad en los modelos de lenguaje a través de métodos innovadores de desaprendizaje.
― 7 minilectura
La investigación revela sesgos en las herramientas de IA utilizadas para contratar, basados en la raza y el género.
― 8 minilectura