Articoli più recenti per Qualità dei Dati

Teoria della statistica Validare modelli statistici con dati contaminati

Questo articolo parla delle sfide nella validazione dei modelli a causa dei dati contaminati.

2025-07-31T22:27:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzare nell'Apprendimento per Rinforzo Offline con SeMOPO

SeMOPO migliora l'apprendimento da dati di bassa qualità separando le informazioni utili dal rumore.

2025-07-29T13:07:42+00:00 ― 5 leggere min

Apprendimento automatico Migliorare gli Standard di Ricerca nel Reinforcement Learning Multi-Agent Offline

Esaminare le questioni chiave nel MARL offline e proporre soluzioni standardizzate.

2025-07-29T05:53:12+00:00 ― 6 leggere min

Metodologia Valutare i dati non probabilistici nelle statistiche

Uno sguardo al ruolo dei dati non probabilistici nei moderni metodi statistici.

2025-07-28T21:52:00+00:00 ― 7 leggere min

Apprendimento automatico L'importanza crescente della valutazione dei dati

Valutare il valore dei dati è fondamentale per migliorare i risultati del machine learning.

2025-07-28T21:01:56+00:00 ― 7 leggere min

Apprendimento automatico Valutazione dei metodi di selezione delle caratteristiche in dati rumorosi

Metodi per identificare le caratteristiche importanti in ambienti di dati di bassa qualità.

2025-07-28T00:47:18+00:00 ― 7 leggere min

Calcolo e linguaggio Uno Sguardo più da Vicino ai Modelli GLM-4

I modelli GLM-4 mostrano capacità migliorate nella comprensione e generazione del linguaggio.

2025-07-27T06:52:54+00:00 ― 9 leggere min

Apprendimento automatico Migliorare la generazione dei dati EHR per avere migliori approfondimenti sulla salute

Un nuovo modello migliora i dati EHR sintetici per applicazioni sanitarie migliori.

2025-07-26T21:39:54+00:00 ― 5 leggere min

Apprendimento automatico Migliorare il Pseudo-labeling con il Framework DIPS

DIPS affronta i problemi di qualità dei dati nel pseudo-etichette per ottenere risultati migliori nel machine learning.

2025-07-26T18:38:12+00:00 ― 5 leggere min

Calcolo e linguaggio Presentiamo FineWeb: un nuovo dataset per modelli linguistici

FineWeb offre 15 trilioni di token per migliorare l'addestramento dei modelli linguistici.

2025-07-24T10:01:12+00:00 ― 7 leggere min

Calcolo e linguaggio Piccoli modelli linguistici e gestione del rumore

Questo articolo esplora come i piccoli modelli linguistici imparano a gestire il rumore nei dati.

2025-07-21T07:53:30+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli VideoEval: Un Nuovo Standard per la Valutazione dei Modelli Video

VideoEval stabilisce un nuovo standard per valutare efficacemente i modelli fondamentali di video.

2025-07-17T18:26:24+00:00 ― 6 leggere min

Apprendimento automatico Affrontare il crollo del modello nell'addestramento dell'IA

Questo articolo parla di come affrontare il crollo del modello usando una selezione di dati migliore e feedback.

2025-07-16T12:48:16+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la qualità del dataset attraverso la rilevazione degli errori di etichettatura

Un nuovo metodo migliora il rilevamento di immagini e testi etichettati in modo errato nei dataset.

2025-07-16T06:37:36+00:00 ― 6 leggere min

Basi di dati Migliorare la gestione dei dati con il trasduttore SQL semantico

Scopri come il Trasduttore SQL Semantico migliora la chiarezza e la gestione dei dati.

2025-07-15T15:52:48+00:00 ― 7 leggere min

Apprendimento automatico L'impatto dei dati rumorosi sull'accuratezza del machine learning

Esplorare come i dati rumorosi influenzano le prestazioni del modello su dati non visti.

2025-07-08T17:53:20+00:00 ― 7 leggere min

Elaborazione di immagini e video Migliorare la rilevazione delle malattie attraverso una gestione di qualità dei dataset

Usare UMAP per trovare errori di etichettatura nei dataset di immagini mediche.

2025-07-08T10:56:15+00:00 ― 6 leggere min

Calcolo e linguaggio Rilevare errori nella traduzione automatica

Questo articolo parla delle sfide nel rilevare le allucinazioni nella traduzione automatica tra diverse lingue.

2025-07-08T06:15:42+00:00 ― 6 leggere min

Calcolo e linguaggio Presentiamo LawLuo: Un Nuovo Approccio all'Assistenza Legale

LawLuo combina più agenti per un'esperienza di consulenza legale migliorata.

2025-07-08T02:10:48+00:00 ― 6 leggere min

Calcolo e linguaggio Le sfide dell'allenamento rigurgitativo nei LLM

Questo documento esamina i limiti dell'uso dei dati generati da LLM per addestrare nuovi modelli.

2025-07-05T23:08:00+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzare i Dati Sintetici per i Modelli di Linguaggio

Un nuovo metodo migliora la qualità dei dati sintetici per un migliore allineamento dei modelli linguistici.

2025-06-30T13:24:06+00:00 ― 6 leggere min

Basi di dati Sviluppi nella Risoluzione delle Entità con ASPen

Presentiamo ASPen, un sistema per migliorare la qualità dei dati attraverso tecniche avanzate di risoluzione delle entità.

2025-06-28T15:11:12+00:00 ― 7 leggere min

Intelligenza artificiale Atto sull'IA dell'UE: Affrontare l'incertezza nei sistemi di IA

Le nuove regole si concentrano sulla trasparenza e sulla gestione dell'incertezza nella tecnologia AI.

2025-06-25T09:53:54+00:00 ― 6 leggere min

Calcolo e linguaggio Adattare i modelli linguistici con risorse limitate

Ricerca su come addestrare modelli linguistici per lingue poco rappresentate in modo efficiente.

2025-06-20T19:49:30+00:00 ― 7 leggere min

Calcolo e linguaggio Ottimizzazione dei modelli linguistici per testi medici

Uno studio per migliorare i modelli linguistici usando articoli medici mirati.

2025-06-17T05:19:12+00:00 ― 6 leggere min

Ingegneria del software Affrontare il debito di giustizia nei sistemi IA

Questo articolo esplora come identificare e gestire i bias nell'IA per risultati equi.

2025-06-16T23:15:48+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Allineare l'IA alla Comprensione Visiva Umana

Un framework per migliorare le performance dell'AI nei compiti visivi imitandone i giudizi umani.

2025-06-14T06:13:12+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Valutare la qualità delle didascalie delle immagini

Questo articolo valuta il sentimento e il significato nelle didascalie delle immagini.

2025-06-12T04:58:36+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli L'impatto dell'etichettatura sulle prestazioni del machine learning

Quest'articolo mette in evidenza come le variazioni delle etichette influenzano i modelli di machine learning.

2025-06-12T01:09:30+00:00 ― 7 leggere min

Metodologia Migliorare la Prontezza dei Dati per il Successo dell'IA

Migliora la qualità dei dati con analisi visive per progetti AI efficaci.

2025-06-09T10:27:08+00:00 ― 5 leggere min

Elaborazione di immagini e video Sfide nell'analisi delle immagini istopatologiche usando il deep learning

Indagine sui problemi del dataset che influenzano l'accuratezza della classificazione delle immagini tessutali.

2025-06-09T01:40:10+00:00 ― 5 leggere min

Teoria della statistica Metodi Bayesiani per Dati Non Allineati

Un nuovo modo per abbinare accuratamente i record in set di dati con errori.

2025-06-04T01:56:52+00:00 ― 5 leggere min

Apprendimento automatico Migliorare il K-Means Clustering con Dati Mancanti

Nuovi metodi migliorano il clustering K-means affrontando i problemi dei dati mancanti.

2025-06-02T11:24:00+00:00 ― 5 leggere min

Fisica biologica PDBBind-Opt: Migliorare i Dati per la Scoperta di Farmaci

Nuovi sistemi migliorano i dati sulle interazioni proteina-ligando per una progettazione migliore dei farmaci.

2025-05-30T23:26:45+00:00 ― 7 leggere min

Apprendimento automatico Le stranezze e le sfide dei modelli di visione-linguaggio

Una panoramica sui punti di forza e le debolezze dei modelli Vision-Language di oggi.

2025-05-28T19:26:51+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare la qualità di Wikipedia in diverse lingue

Questo pezzo esamina la qualità variabile dei contenuti di Wikipedia in diverse lingue.

2025-05-27T10:10:12+00:00 ― 7 leggere min

Intelligenza artificiale Capire la Granularità delle Classi nei Grafi della Conoscenza

La granularità della classe aiuta a organizzare i grafi di conoscenza per un recupero delle informazioni migliore.

2025-05-26T10:01:39+00:00 ― 6 leggere min

Ingegneria del software I Rischi Nascosti dei Dati Sbagliati nel Deep Learning

Dati scadenti possono portare a una scarsa performance dei modelli nelle applicazioni di deep learning.

2025-05-20T17:13:12+00:00 ― 7 leggere min

Apprendimento automatico Affrontare le sfide del rumore nelle etichette nel deep learning

Il rumore delle etichette può ostacolare i modelli di deep learning; nuovi metodi migliorano l'accuratezza.

2025-05-01T16:21:20+00:00 ― 7 leggere min

Apprendimento automatico Affrontare la sfida del rilevamento del cyberbullismo

Capire i pregiudizi nei dati del machine learning per una rilevazione efficace del cyberbullismo.

2025-04-30T03:12:00+00:00 ― 8 leggere min