Zyda, un conjunto de datos con 1.3 billones de tokens, mejora el entrenamiento de modelos de lenguaje.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Zyda, un conjunto de datos con 1.3 billones de tokens, mejora el entrenamiento de modelos de lenguaje.
― 7 minilectura
FineWeb ofrece 15 billones de tokens para mejorar el entrenamiento de modelos de lenguaje.
― 9 minilectura
La fibotención mejora la eficiencia en la comprensión visual de máquinas.
― 5 minilectura
Los investigadores estudian métodos para proteger información sensible en modelos de clasificación de texto.
― 8 minilectura
Nuevo enfoque TOKEN mejora el manejo de eventos de conducción raros en vehículos autónomos.
― 9 minilectura
STRIDE predice de manera eficiente los nombres de variables perdidas y sus tipos en software decompilado.
― 7 minilectura
La investigación muestra que cambios simples en la entrada pueden llevar a resultados perjudiciales en los LLMs.
― 7 minilectura
MaskMoE mejora el aprendizaje de tokens en modelos MoE al potenciar el rendimiento de tokens poco frecuentes.
― 7 minilectura
TokenSHAP revela cómo las palabras impactan las respuestas de los modelos de lenguaje.
― 8 minilectura
LookupViT mejora las tareas de reconocimiento visual a través de un procesamiento de tokens eficiente.
― 7 minilectura
ChatQA 2 mejora el rendimiento en el procesamiento de textos largos y tareas de recuperación.
― 7 minilectura
Un nuevo modelo mejora la comprensión del lenguaje a través de una representación de datos estructurada.
― 7 minilectura
Un enfoque rentable para analizar imágenes y texto de alta resolución.
― 6 minilectura
MHSSMamba mejora la precisión en el procesamiento y clasificación de imágenes hiperspectrales.
― 6 minilectura
Conoce 500xCompressor, un nuevo método para comprimir prompts de manera efectiva.
― 7 minilectura
Explorando los retos de reorganizar tokens en grafos.
― 6 minilectura
SAMSA mejora la eficiencia de la auto-atención para varios tipos de datos.
― 6 minilectura
Un estudio de diferentes tokens y sus patrones en el espacio Web3 en evolución.
― 7 minilectura
El estudio evalúa la originalidad en imágenes generadas por IA usando mediciones de tokens.
― 8 minilectura
Un nuevo método mejora la precisión para contar objetos en imágenes generadas.
― 9 minilectura
Este artículo examina cómo la gestión de tokens en ColBERT afecta el ranking de documentos.
― 6 minilectura
X-Codec mejora la generación de audio al integrar comprensión semántica en el procesamiento.
― 7 minilectura
Este artículo compara las representaciones de voz discretas y continuas para un reconocimiento de voz efectivo.
― 6 minilectura
Un nuevo algoritmo mejora la creación de factores alfa para obtener mejores ideas de inversión.
― 6 minilectura
Examinando el papel de la atención en diferentes capas de los modelos de lenguaje.
― 5 minilectura
Este artículo habla sobre los avances en la protección de los contratos inteligentes contra vulnerabilidades y pérdidas financieras.
― 7 minilectura
Un nuevo método para mejorar la respuesta de los modelos de lenguaje grande a las instrucciones de los usuarios.
― 2 minilectura
Modelos recientes mejoran la capacidad de la IA para generar y entender varios tipos de medios.
― 5 minilectura
SATA mejora la robustez y eficiencia de los Transformadores de Visión para tareas de clasificación de imágenes.
― 5 minilectura
Examinando las vulnerabilidades en métodos de marcas de agua contra ataques de parafraseo.
― 8 minilectura
RLT reduce el tiempo de entrenamiento para IA en procesamiento de video al eliminar tokens innecesarios.
― 6 minilectura
Una mirada a SuffixDecoding y su impacto en la eficiencia de los modelos de lenguaje.
― 6 minilectura
Examinando la línea entre los artículos científicos generados por IA y los escritos por humanos.
― 5 minilectura
MDBPE optimiza el procesamiento de imágenes comprimiendo los datos visuales de manera eficiente.
― 7 minilectura
Un método para mejorar la retención de detalles importantes en textos largos por parte de los LLMs.
― 6 minilectura
Presentamos los Autoencoders Máscarados de Video Largo para una mejor comprensión del video.
― 7 minilectura
La cuantización factorizada mejora la generación de imágenes a través de una gestión eficiente de tokens.
― 6 minilectura
Investigadores mejoran la detección de voz para búsquedas más rápidas y precisas.
― 6 minilectura
Un esfuerzo global en el entrenamiento de IA da como resultado el modelo de lenguaje de última generación INTELLECT-1.
― 6 minilectura
Los investigadores están mejorando el rendimiento de los LLMs mientras ahorran recursos.
― 8 minilectura