Articoli più recenti per Multimodale

Visione artificiale e riconoscimento di modelli Introducendo la Maschera di Attenzione Apprendibile per Compiti Multimodali

Un nuovo metodo per migliorare i meccanismi di attenzione nella lavorazione di dati complessi.

2025-08-02T16:00:36+00:00 ― 7 leggere min

Apprendimento automatico Migliorare il riconoscimento dell'attività umana con dati multimodali

Un nuovo approccio migliora il riconoscimento delle attività combinando vari tipi di dati.

2025-08-01T05:30:48+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Setokim: Avanzando i modelli linguistici multimodali

Setokim migliora la fusione tra comprensione visiva e testuale grazie a un'innovativa tokenizzazione.

2025-08-01T00:06:54+00:00 ― 8 leggere min

Calcolo e linguaggio mOSCAR: Un Nuovo Dataset per l'AI Multimodale

mOSCAR offre un dataset multilingue per migliorare la comprensione del testo e delle immagini da parte dell'IA.

2025-07-30T03:13:00+00:00 ― 7 leggere min

Apprendimento automatico Integrando Visione e Linguaggio nel Cervello

Questo studio mostra come il cervello combina le informazioni visive e linguistiche.

2025-07-22T21:29:48+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Valutare l'apprendimento multimodale nei modelli di linguaggio

Questo studio esamina come i dati visivi e testuali influenzano le prestazioni del modello.

2025-07-22T07:03:54+00:00 ― 7 leggere min

Calcolo e linguaggio Un nuovo approccio alle previsioni del modello

Un metodo di ensemble innovativo migliora l'accuratezza dei modelli linguistici e visivi.

2025-07-19T17:10:54+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Segmentazione Audio-Visiva Referenziale: Un Nuovo Approccio

Combinare audio e informazioni visive migliora il riconoscimento degli oggetti nei video.

2025-07-13T10:17:30+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il rilevamento delle fake news con il framework IMFND

Un nuovo framework migliora il rilevamento delle fake news usando testo e immagini.

2025-07-12T22:34:24+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nelle tecniche di apprendimento multimodale

Un nuovo modo per migliorare l'apprendimento multimodale con dati mancanti.

2025-07-08T01:39:12+00:00 ― 6 leggere min

Apprendimento automatico Avanzare la sanità con il machine learning multimodale

Un nuovo sistema migliora la previsione delle malattie usando dati sanitari vari.

2025-07-07T03:16:12+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare le capacità Zero-Shot dei LLM multimodali

Una valutazione delle prestazioni zero-shot dei LLM multimodali su vari compiti.

2025-07-05T08:36:36+00:00 ― 5 leggere min

Biblioteche digitali HALvest: Un Nuovo Dataset per la Ricerca Accademica

HALvest combina reti di citazioni e testi per ottenere spunti di ricerca migliori.

2025-07-04T17:51:48+00:00 ― 5 leggere min

Metodologia Analizzare dati circolari negli studi sulla migrazione degli uccelli

Scopri come i dati circolari influenzano l'analisi della migrazione degli uccelli e gli sforzi di conservazione.

2025-07-03T21:54:04+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzando la formazione per modelli di linguaggio multimodali di grandi dimensioni

Un nuovo sistema migliora l'efficienza dell'addestramento dei modelli di linguaggio multimodali di grandi dimensioni.

2025-07-01T16:55:12+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'efficienza nell'addestramento di modelli multimodali

Un nuovo metodo migliora l'efficienza e le prestazioni dei modelli di linguaggio multimodali di grandi dimensioni.

2025-06-30T21:33:54+00:00 ― 5 leggere min

Apprendimento automatico Migliorare i Metodi di Campionamento per Distribuzioni Complesse

Una nuova tecnica semplifica il campionamento da distribuzioni di probabilità complesse nella scienza dei dati e nella finanza.

2025-06-26T23:00:44+00:00 ― 6 leggere min

Apprendimento automatico Migliorare la comprensione dei computer attraverso metodi incentrati sul testo

Questo articolo parla di come convertire i dati in testo migliori la comprensione dei computer.

2025-06-25T14:22:30+00:00 ― 6 leggere min

Calcolo e linguaggio Apprendimento in contesto: affrontare le sfide nei modelli di intelligenza artificiale

Esplorare come i modelli linguistici grandi apprendono dagli esempi in vari contesti.

2025-06-23T02:12:12+00:00 ― 6 leggere min

Apprendimento automatico Inf-MLLM: Un Nuovo Approccio al Processamento Multimodale

Inf-MLLM migliora l'efficienza nella gestione di flussi di dati complessi con risorse limitate.

2025-06-14T00:57:12+00:00 ― 5 leggere min

Calcolo e linguaggio Capire l'intento nei post sui social media in Bangla

Un framework per analizzare i contenuti dei social media in Bangla tramite testi e immagini.

2025-06-12T03:31:42+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare le tecniche di rilevamento delle anomalie nei video

Un nuovo metodo combina video, audio e algoritmi per una migliore rilevazione delle anomalie.

2025-06-10T15:03:24+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Il futuro dei motori di ricerca multimodali

Esaminando il ruolo dei LMM nell trasformare le capacità di ricerca con testi e immagini.

2025-06-09T12:35:30+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo InfiMM-WebMath-40B: Un Nuovo Dataset per il Ragionamento Matematico Multimodale

Un nuovo dataset punta a migliorare il ragionamento multimodale nei modelli linguistici.

2025-06-09T06:24:12+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare i modelli di linguaggio multimodali con OmniBench

Un nuovo strumento valuta le prestazioni dei modelli di linguaggio su diversi tipi di dati.

2025-06-07T16:21:06+00:00 ― 5 leggere min

Recupero delle informazioni Avanzare i sistemi di raccomandazione multimodali grazie a una migliore estrazione delle caratteristiche

Uno studio su come migliorare i sistemi di raccomandazione concentrandosi sulle tecniche di estrazione delle caratteristiche.

2025-06-06T12:02:36+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Mappare i cumuli di rinoceronte per migliorare gli sforzi di conservazione

Un nuovo metodo traccia i rinoceronti usando i loro escrementi per combattere il bracconaggio.

2025-06-05T05:21:54+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Nuovi modelli che trasformano l'AI multimodale

I modelli recenti migliorano la capacità dell'AI di generare e comprendere diversi media.

2025-06-04T08:49:30+00:00 ― 5 leggere min

Apprendimento automatico Come i robot combinano i sensi per un'interazione migliore

I robot imparano a unire le informazioni sensoriali per capire meglio e reagire.

2025-05-28T12:36:39+00:00 ― 7 leggere min

Intelligenza artificiale Combinare numeri e parole per previsioni migliori

Gli scienziati mescolano dati delle serie temporali con testi per migliorare le previsioni del tempo.

2025-05-25T10:19:12+00:00 ― 7 leggere min

Calcolo e linguaggio Investigare la coerenza cross-modale nei modelli di intelligenza artificiale

Esaminare come i modelli di intelligenza artificiale gestiscono insieme testi e immagini.

2025-05-23T05:28:03+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare il ragionamento nei modelli multimodali

Un nuovo metodo migliora le abilità di ragionamento nei modelli linguistici usando l'ottimizzazione delle preferenze.

2025-05-22T16:25:03+00:00 ― 5 leggere min

Intelligenza artificiale AdaptAgent: Un Nuovo Modo per gli Agenti Web di Imparare

AdaptAgent aiuta gli agenti web a imparare compiti con meno dimostrazioni.

2025-05-16T13:08:00+00:00 ― 7 leggere min

Calcolo e linguaggio Come il suono aiuta le macchine a capire le barzellette

I segnali sonori migliorano la comprensione delle macchine per l'umorismo e i giochi di parole.

2025-04-29T08:07:15+00:00 ― 5 leggere min

Intelligenza artificiale Trasformare la diagnosi medica con dati multimodali

Combinare vari tipi di dati medici migliora la diagnosi e la pianificazione del trattamento.

2025-04-23T11:11:15+00:00 ― 6 leggere min

Calcolo e linguaggio BabyLM Challenge: Colleghiamo i bambini e l'IA nell'apprendimento delle lingue

Una competizione per migliorare il modo in cui le macchine imparano le lingue come fanno i bambini.

2025-04-07T04:21:27+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli COEF-VQ: Il Futuro della Qualità Video sui Social Media

Scopri come COEF-VQ garantisce un'alta qualità video per un'esperienza utente migliore.

2025-03-22T17:36:09+00:00 ― 7 leggere min

Apprendimento automatico Rivoluzionare le previsioni azionarie con nuovi modelli

I trasformatori di ordine superiore migliorano le previsioni sui movimenti di azioni usando fonti di dati diverse.

2025-03-16T17:34:20+00:00 ― 9 leggere min

Calcolo e linguaggio RapGuard: Un Nuovo Scudo di Sicurezza per i Modelli AI

RapGuard offre sicurezza consapevole del contesto per modelli di linguaggio multimodali di grandi dimensioni.

2025-01-25T11:47:51+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Una nuova era nella risposta alle domande visive

I progressi nell'IA migliorano le capacità di risposta a domande visive.

2025-01-18T05:39:18+00:00 ― 6 leggere min