La investigación muestra que la inconsistencia entre texto e imagen aumenta con la popularidad de las publicaciones en redes sociales.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
La investigación muestra que la inconsistencia entre texto e imagen aumenta con la popularidad de las publicaciones en redes sociales.
― 5 minilectura
Nuevo conjunto de datos mejora la generación de audio a partir de descripciones de texto detalladas.
― 6 minilectura
Una nueva herramienta para probar modelos de lenguaje en entornos ruidosos.
― 5 minilectura
Un nuevo método para crear mallas de referencia más limpias a partir de formas 3D dinámicas.
― 6 minilectura
Un nuevo método reduce la necesidad de datos etiquetados en tareas de visión por computadora.
― 6 minilectura
Este artículo presenta un método para generar sonido preciso a partir de videos y texto.
― 8 minilectura
Presentando un nuevo modelo que combina texto y diseño de manera eficiente para una mejor comprensión de documentos.
― 6 minilectura
Un nuevo método mejora la gestión de datos de video para una mejor comprensión y eficiencia.
― 6 minilectura
El conjunto de datos AMEX mejora la comprensión de la IA sobre las interfaces de apps móviles.
― 8 minilectura
Presentamos datasets MERGE para mejorar la clasificación de emociones en la música.
― 7 minilectura
Explorando cómo los videojuegos pueden enseñar habilidades de programación esenciales de manera efectiva y entretenida.
― 6 minilectura
Combinando sonido e imágenes para sistemas de reconocimiento más inteligentes.
― 8 minilectura
VCoME ayuda a los usuarios a crear videos verbales atractivos fácilmente.
― 5 minilectura
Los investigadores buscan crear sonidos que coincidan con videos en silencio, mejorando la experiencia de los espectadores.
― 6 minilectura
Un nuevo enfoque mejora la claridad de las preguntas generadas a partir de imágenes.
― 7 minilectura
Aprende a asegurar datos CSV con firmas digitales.
― 6 minilectura
Este método mejora la búsqueda de imágenes combinando imágenes y texto de manera efectiva.
― 6 minilectura
LeRF combina el aprendizaje profundo y la interpolación para mejorar el redimensionamiento de imágenes.
― 9 minilectura
Nuevo modelo de IA mejora la interpretación de radiografías de tórax para mejores diagnósticos.
― 8 minilectura
Un nuevo método para generar contenido atractivo en redes sociales usando IA.
― 7 minilectura
Descubre cómo la IA está transformando la generación de música con BandControlNet.
― 7 minilectura
Un nuevo enfoque mejora la detección de deepfakes usando análisis audiovisual.
― 7 minilectura
Un nuevo método mejora la detección de tartamudeo combinando datos de audio, video y texto.
― 7 minilectura
Un estudio sobre cómo mejorar la localización de fuentes de sonido aprovechando mejor la información auditiva y visual.
― 9 minilectura
TemporalStory mejora la generación de imágenes para contar historias al aumentar la coherencia y el contexto.
― 6 minilectura
Una nueva herramienta para evaluar la replicación en la música hecha por IA.
― 9 minilectura
Una mirada a los métodos para mejorar la calidad de imagen afectada por la neblina.
― 8 minilectura
El conjunto de datos TGIF ayuda a detectar técnicas avanzadas de manipulación de imágenes.
― 6 minilectura
Descubre cómo la transmisión IP y el etiquetado de audio están transformando la entrega de contenido.
― 7 minilectura
Integrando IA para mejorar estrategias de marketing y la efectividad de las campañas.
― 7 minilectura
X-Former mejora cómo los modelos combinan la comprensión de imágenes y texto.
― 10 minilectura
Combatiendo la información engañosa con nuevos métodos y tecnologías.
― 6 minilectura
Un nuevo sistema que combina análisis de texto e imagen para combatir la desinformación.
― 6 minilectura
El nuevo método RoE mejora la eficiencia de los modelos de lenguaje grandes multimodales con enrutamiento dinámico.
― 9 minilectura
Presentamos 360VFI para mejorar la calidad y la experiencia del video en 360 grados.
― 6 minilectura
Un nuevo modelo combina audio y video para una mejor comprensión.
― 6 minilectura
Un nuevo método mejora la separación de voces en entornos ruidosos con múltiples hablantes.
― 6 minilectura
Este estudio revisa métodos de muestreo de fotogramas para mejorar la recuperación de contenido de video.
― 7 minilectura
Un nuevo marco simplifica la creación de clips destacados específicos de jugadores a partir de videos de fútbol.
― 8 minilectura
HaloQuest aborda problemas de alucinación en modelos de lenguaje-visual con un nuevo conjunto de datos.
― 12 minilectura