Artigos mais recentes para Ajuste fino

Física de Altas Energias - Fenomenologia Investigando a Massa do Neutrino com Mistura Trimaximal

Este artigo explora a massa do neutrino através de zeros menores na matriz de massa.

2025-09-18T15:52:48+00:00 ― 6 min ler

Aprendizagem de máquinas Novo Método para Ajuste Fino Privado de Modelos de Linguagem

DP-ZO equilibra privacidade e desempenho no treinamento de modelos de linguagem.

2025-09-18T12:02:54+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Aprimorando a Adaptação do Modelo com Aumentações Direcionadas

Um novo framework melhora o desempenho do modelo em dados não vistos usando mudanças específicas.

2025-09-18T07:10:36+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Edição de Imagem Eficiente com a Estrutura EGAN

Novos métodos melhoram a velocidade e a qualidade da edição de imagens usando modelos menores.

2025-09-17T14:11:30+00:00 ― 6 min ler

Física de Altas Energias - Fenomenologia Abordando o Problema da Hierarquia com Modelos de Higgs Composto

Novos modelos exploram a estabilidade da escala fraca na física de altas energias.

2025-09-17T08:13:06+00:00 ― 5 min ler

Engenharia de software Abordando a Duplicação de Código entre Conjuntos de Dados na Avaliação de Modelos

Analisando os efeitos da duplicação de código entre conjuntos de dados nas métricas de desempenho do modelo.

2025-09-17T01:33:06+00:00 ― 9 min ler

Aprendizagem de máquinas Ajustando Redes Neurais Podadas com Resfriamento Estocástico de Subredes

Um novo método que melhora redes neurais podadas pra ter um desempenho melhor.

2025-09-16T19:13:54+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões O Papel da IA em Mapear Características do Permafrost

Ferramentas de IA como o SAM tão mudando a forma como a gente mapeia o permafrost e entende as mudanças climáticas.

2025-09-16T18:58:06+00:00 ― 8 min ler

Física biológica Entendendo a Criticalidade em Sistemas Biológicos

Uma visão geral da criticidade intrínseca e extrínseca em sistemas biológicos.

2025-09-16T15:45:00+00:00 ― 8 min ler

Computação e linguagem Avanços no Raciocínio Matemático para LLMs

Esse estudo melhora a forma como os modelos de linguagem lidam com tarefas de raciocínio matemático.

2025-09-16T14:37:24+00:00 ― 6 min ler

Computação e linguagem Melhorando a Resposta a Perguntas com Dados Limitados

Estratégias pra melhorar modelos de QA quando os dados rotulados são escassos.

2025-09-16T08:41:54+00:00 ― 8 min ler

Aprendizagem de máquinas Um Novo Método para Ajustar Modelos Fundamentais

AutoFT melhora o desempenho do modelo em dados não vistos através de técnicas inovadoras de ajuste fino.

2025-09-16T04:29:06+00:00 ― 8 min ler

Aprendizagem de máquinas Acelerando Modelos de Linguagem Grandes com Cabeças Extras

Um novo método acelera a geração de texto em LLM usando cabeçotes de previsão adicionais.

2025-09-15T18:05:00+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços na Detecção de Doenças Oculares Usando IA

Um novo framework de IA melhora a detecção de doenças oculares por meio de técnicas de imagem aprimoradas.

2025-09-15T09:23:36+00:00 ― 7 min ler

Computação e linguagem Novo Método para Treinamento Eficiente de Modelos de Linguagem

Um método melhora a eficiência no treinamento e uso de grandes modelos de linguagem.

2025-09-15T04:55:00+00:00 ― 8 min ler

Bioinformática Melhorando o Diagnóstico de Doenças Raras com Vocabulário Padronizado

Pesquisas mostram que modelos ajustados têm potencial para entender melhor as doenças raras.

2025-09-14T15:04:42+00:00 ― 8 min ler

Criptografia e segurança Abordando Ataques de Jailbreak Multilíngues em Modelos de Linguagem

Estudo revela os riscos de ataques de jailbreak multilíngues em grandes modelos de linguagem.

2025-09-13T03:56:12+00:00 ― 6 min ler

Engenharia de software Automatizando Revisões de Código com GPT-3.5: Um Estudo

Esse artigo explora métodos para usar o GPT-3.5 pra automatizar revisões de código de forma eficaz.

2025-09-12T19:30:36+00:00 ― 7 min ler

Aprendizagem de máquinas Desafios e Estratégias para Modelos de Linguagem Grandes

Analisando o custo e a eficiência de grandes modelos de linguagem em várias tarefas.

2025-09-12T16:52:36+00:00 ― 7 min ler

Computação e linguagem Avaliação de Modelos de Linguagem: Desempenho Dentro do Tópico vs Desempenho Cruzado de Tópicos

Este estudo analisa como os modelos de linguagem lidam com tópicos familiares e não familiares.

2025-09-12T01:52:00+00:00 ― 7 min ler

Aprendizagem de máquinas Modelos de Linguagem Grande na Análise de Séries Temporais

Explorando o uso de LLMs pra analisar dados de séries temporais em várias áreas.

2025-09-11T05:03:48+00:00 ― 10 min ler

Aprendizagem de máquinas Realinhamento de Tempo de Decodificação: Uma Nova Abordagem para Treinamento de Modelos de Linguagem

DeRa oferece um jeito de ajustar o alinhamento do modelo de linguagem sem precisar re-treinar.

2025-09-11T02:33:42+00:00 ― 7 min ler

Computação e linguagem Identificando Bilhetes Vencedores em Modelos de Linguagem Multilíngues

Um método pra ajustar modelos de linguagem usando menos parâmetros.

2025-09-10T23:08:18+00:00 ― 7 min ler

Aprendizagem de máquinas Como o Barulho Afeta o Treinamento de Modelos de Linguagem

Esse artigo analisa o impacto do barulho na performance de modelos de linguagem.

2025-09-10T17:52:18+00:00 ― 8 min ler

Aprendizagem de máquinas Avanços em Técnicas de Quantização para Modelos de Aprendizado de Máquina

Aprenda como novas técnicas melhoram a eficiência de grandes modelos de aprendizado de máquina.

2025-09-10T13:31:36+00:00 ― 4 min ler

Aprendizagem de máquinas Melhorando a Explicabilidade em Modelos de Aprendizado de Máquina

Novos métodos melhoram a clareza das previsões de aprendizado de máquina.

2025-09-10T10:35:28+00:00 ― 9 min ler

Aprendizagem de máquinas Melhorando a Confiança em Modelos de Visão-Linguagem

Novo método melhora a confiabilidade das previsões do modelo em aplicações do mundo real.

2025-09-10T01:09:00+00:00 ― 7 min ler

Computação e linguagem Abordando o Viés Cultural em Modelos de Linguagem

Uma nova abordagem pra integrar diferentes insights culturais nos modelos de linguagem.

2025-09-10T00:45:18+00:00 ― 9 min ler

Interação Homem-Computador Geração de Ideias Inovadoras com a Ajuda da IA

Um novo método pra estimular a criatividade na resolução de problemas com o apoio da IA.

2025-09-09T22:23:06+00:00 ― 10 min ler

Inteligência Artificial Desafios em Desenvolver Agentes de IA Eficazes

Explorando questões na criação de modelos e soluções de IA para tomada de decisão.

2025-09-09T21:19:54+00:00 ― 6 min ler

Processamento de Áudio e Fala Apresentando o AV-SUPERB: Um Novo Padrão para Modelos Audiovisuais

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler

Recuperação de informação Avanços em Modelos de Recuperação de Documentos Longos

Novas ferramentas melhoram como os sistemas conseguem buscar informações em documentos longos.

2025-09-08T20:26:48+00:00 ― 5 min ler

Computação e linguagem O Papel dos Modelos de Linguagem nas Decisões de Contratação

Explorando como modelos de linguagem refletem traços de personalidade na recrutamento.

2025-09-08T12:17:00+00:00 ― 8 min ler

Aprendizagem de máquinas Melhorando o Ajuste Fino de Redes Neurais com Aprendizado Ativo

Este estudo melhora a eficiência do fine-tuning em redes neurais usando aprendizado ativo transdutivo.

2025-09-08T10:42:12+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando o Whisper para Línguas de Baixo Recurso

Melhorando o reconhecimento de fala do Whisper para o vietnamita e outras línguas com poucos recursos.

2025-09-08T03:55:10+00:00 ― 5 min ler

Computação e linguagem Adaptando Modelos de Linguagem Sem Dados Caros

Um novo método pra adaptar LLMs sem precisar de muitos rótulos.

2025-09-07T13:22:24+00:00 ― 10 min ler

Aprendizagem de máquinas Adaptando Modelos de Linguagem ao Feedback do Usuário

Esse artigo fala sobre um jeito de melhorar os LLMs usando feedback verbal sem generalizar demais.

2025-09-07T11:16:00+00:00 ― 12 min ler

Computação e linguagem LoRETTA: Um Novo Método para Ajustar Modelos de Linguagem

LoRETTA melhora a eficiência de ajuste fino para grandes modelos de linguagem com menos parâmetros.

2025-09-07T03:29:54+00:00 ― 7 min ler

Aprendizagem de máquinas Entendendo Ataques de Envenenamento de Dados Indiscriminados em Aprendizado de Máquina

Explorando as ameaças que o envenenamento indiscriminado de dados traz pro aprendizado autossupervisionado.

2025-09-06T18:01:06+00:00 ― 9 min ler

Computação e linguagem Riscos de Exposição de Dados em Modelos de Linguagem

Analisando como o fine-tuning aumenta o risco de revelar dados sensíveis de treinamento.

2025-09-06T12:37:12+00:00 ― 7 min ler