Esse artigo investiga vulnerabilidades em modelos de fala e maneiras de aumentar a segurança deles.
― 6 min ler
Ciência de ponta explicada de forma simples
Esse artigo investiga vulnerabilidades em modelos de fala e maneiras de aumentar a segurança deles.
― 6 min ler
Uma nova abordagem melhora a diversidade dos prompts para modelos de linguagem mais seguros.
― 8 min ler
Este estudo analisa como medidas conjuntas avaliam a justiça e a relevância em sistemas de recomendação.
― 7 min ler
Um novo método melhora a qualidade das amostras geradas em modelos de difusão.
― 6 min ler
Este artigo analisa o papel da participação da comunidade no desenvolvimento de sistemas de IA.
― 10 min ler
Um novo método pra avaliar viés em modelos de linguagem busca respostas mais justas da IA.
― 8 min ler
Esse estudo avalia a confiabilidade das ferramentas de IA na prática jurídica.
― 7 min ler
Novos métodos lidam com preocupações sobre originalidade em textos gerados por IA.
― 7 min ler
Entender como a IA toma decisões é fundamental pra ter confiança e usar de forma ética.
― 6 min ler
Examinando os riscos e o uso indevido de grandes modelos de linguagem no cibercrime.
― 7 min ler
O CV-VAE melhora a eficiência e a qualidade da geração de vídeos nos modelos existentes.
― 8 min ler
Uma estrutura que detecta anomalias em gráficos enquanto promove um tratamento justo.
― 8 min ler
Uma estrutura pra identificar e reduzir os preconceitos em conjuntos de dados de treinamento.
― 8 min ler
Abordagem inovadora pra guiar modelos de linguagem grandes usando autoavaliação.
― 5 min ler
Um estudo sobre como ajustar agentes de controle de computador pra melhorar o desempenho em tarefas.
― 8 min ler
Analisando o papel da Randomização na criação de sistemas de aprendizado de máquina justos.
― 8 min ler
Examinando como os LLMs transformam o acesso e a interação com dados.
― 6 min ler
Um novo método melhora o alinhamento e a segurança de grandes modelos de linguagem.
― 7 min ler
Um olhar sobre técnicas para ensinar agentes a seguirem o comportamento de experts de forma eficaz.
― 7 min ler
Um novo framework pra melhorar o aprendizado dos agentes de IA através de jogos modificados da Atari.
― 8 min ler
Um novo método pra alinhar aprendizado de máquina com o pensamento humano usando similaridade generativa.
― 7 min ler
Explore técnicas e desafios para deixar os modelos de IA mais compreensíveis.
― 9 min ler
Os sistemas têm que levar em conta os valores humanos na hora de tomar decisões pra ter resultados justos.
― 8 min ler
Pesquisas mostram como a demografia molda as opiniões sobre justiça na moderação de conteúdo de IA.
― 7 min ler
Este artigo discute métodos para garantir a justiça na IA por meio de técnicas de aprendizado auto-supervisionado.
― 7 min ler
Examinando como os LLMs garantem segurança e o impacto dos jailbreaks.
― 7 min ler
Uma ferramenta pra avaliar a segurança de modelos de linguagem avançados.
― 6 min ler
Investigando vulnerabilidades em métodos de marca d'água de áudio contra ameaças do mundo real.
― 9 min ler
Uma olhada nos desafios e melhorias no desempenho de modelos de IA.
― 7 min ler
Um novo framework lida com conflitos de justiça em aprendizado de máquina de forma eficaz.
― 7 min ler
Uma abordagem nova melhora a detecção de imagens falsas criadas por IA.
― 7 min ler
Um conjunto de dados completo que junta imagens e texto pra ajudar o aprendizado de máquina.
― 8 min ler
Uma nova perspectiva sobre como melhorar a criação de imagens através da amostragem por destilação de pontuação.
― 8 min ler
Um novo padrão pra avaliar métodos de detecção de texto gerado por IA.
― 10 min ler
Avaliando os riscos de resultados tendenciosos em robôs usando modelos de linguagem.
― 7 min ler
Um olhar sobre como garantir que as tecnologias de IA sejam confiáveis e dignas de confiança.
― 7 min ler
Explorando o impacto da IA no raciocínio jurídico e na tomada de decisão.
― 8 min ler
Esse método remove efetivamente material protegido por direitos autorais enquanto mantém o desempenho do modelo.
― 7 min ler
Um novo método melhora a clareza na tomada de decisões de modelos de IA.
― 6 min ler
Analisando os preconceitos em modelos de linguagem usados para análise e soluções de saúde mental.
― 10 min ler