Articoli più recenti per Valutazione della tecnologia

Uno sguardo nuovo su come l'IA risponde a domande mediche e sulla sua efficacia.

2025-05-23T17:12:45+00:00 ― 6 leggere min

Un nuovo metodo migliora il modo in cui valutiamo la generazione di immagini partendo dal testo.

2025-05-23T08:56:51+00:00 ― 8 leggere min

Un'analisi della capacità di ChatGPT di consigliare film in modo efficace.

2025-05-20T17:00:09+00:00 ― 5 leggere min

Scopri come il ranking a coppie aiuta a scegliere il miglior modello di linguaggio.

2025-05-19T04:28:00+00:00 ― 8 leggere min

SpecTool porta chiarezza agli errori degli LLM nell'uso degli strumenti.

2025-05-16T16:30:40+00:00 ― 4 leggere min

Valutare l'efficacia dei modelli linguistici nei compiti di coding con nuovi benchmark.

2025-05-15T17:42:40+00:00 ― 5 leggere min

AbilityLens standardizza la valutazione per modelli di linguaggio multimodali di grandi dimensioni.

2025-05-15T13:54:40+00:00 ― 6 leggere min

Scopri come SelfPrompt aiuta a valutare l'efficacia dei modelli linguistici in modo efficace.

2025-04-27T12:04:45+00:00 ― 4 leggere min

Valutare le capacità dei modelli linguistici nella creazione di dati sintetici usando AgoraBench.

2025-04-17T19:33:09+00:00 ― 5 leggere min

Esplorando le questioni di valutazione nell'Intelligenza Artificiale Esplicabile e la ricerca della fiducia.

2025-04-03T20:54:36+00:00 ― 6 leggere min

Uno strumento per valutare le risposte di sicurezza dei grandi modelli linguistici in Cina.

2025-03-05T07:30:00+00:00 ― 6 leggere min

Nuovi metodi valutano la qualità dei volti umani creati dall'IA per realismo e fascino.

2025-02-25T12:31:03+00:00 ― 10 leggere min

MVTamperBench valuta i VLM contro le tecniche di manomissione video per una maggiore affidabilità.

2025-01-23T08:26:15+00:00 ― 6 leggere min