Um estudo comparando o desempenho de segurança de modelos de linguagem populares.
― 6 min ler
Ciência de ponta explicada de forma simples
Um estudo comparando o desempenho de segurança de modelos de linguagem populares.
― 6 min ler
Combinar detecção de OOD com Previsão Conformal aumenta a confiabilidade do modelo.
― 7 min ler
Aprenda como dividir tarefas complexas ajuda os robôs a se moverem de forma eficiente.
― 6 min ler
Um novo conjunto de dados avalia como os modelos de linguagem lidam com conteúdo prejudicial em diferentes culturas.
― 6 min ler
Um olhar sobre como as redes neurais processam informações e suas implicações.
― 5 min ler
Uma nova abordagem para análise de segurança usando funções de barreira estocásticas por partes.
― 9 min ler
Um método pra treinar robôs pra tarefas complexas garantindo segurança.
― 8 min ler
Um novo método melhora a segurança em acessibilidade de alta dimensão para veículos autônomos.
― 7 min ler
Usando o valor de troca pra ensinar IA a ter comportamentos seguros e eficazes a partir dos humanos.
― 7 min ler
Um novo método que melhora a estimativa de incerteza em modelos de IA para dispositivos de borda.
― 9 min ler
Novo método aumenta a segurança da direção de robôs enquanto aprende a acelerar.
― 7 min ler
Apresentando um método inovador pra melhorar o treinamento e a segurança dos robôs.
― 9 min ler
Esse artigo fala sobre o design de controladores de rede neural seguros para sistemas críticos.
― 7 min ler
Este artigo fala sobre como melhorar as CNNs aproveitando informações de baixa frequência para ter mais resistência contra ataques adversariais.
― 7 min ler
Explorando restrições de dano contrafactual pra uma tomada de decisão mais segura em IA.
― 8 min ler
O Escudo Preditivo Dinâmico melhora a segurança e a eficiência no aprendizado por reforço.
― 7 min ler
Um método pra melhorar a detecção de objetos em ambientes desconhecidos usando treinamento de domínio de fonte única.
― 9 min ler
O AdvUnlearn melhora a segurança na geração de imagens, juntando unlearning com treinamento adversarial.
― 6 min ler
Este artigo fala sobre novos métodos para explicar as decisões da IA em detecção de objetos.
― 8 min ler
Novos métodos melhoram a detecção de amostras fora da curva em ambientes de dados mistos.
― 8 min ler
Esse artigo analisa os riscos de ajustar modelos de linguagem pra segurança.
― 4 min ler
Um novo método permite que os agentes sigam as regras de segurança em uma linguagem simples.
― 8 min ler
Este estudo explora o uso de modelos menores para melhorar a segurança em sistemas de IA.
― 6 min ler
Um novo método para os agentes otimizarem o desempenho enquanto garantem que as restrições sejam cumpridas.
― 7 min ler
Esse artigo fala sobre métodos de calibração essenciais para detectores de objetos em aplicações críticas.
― 7 min ler
Pesquisas mostram que existem preconceitos nos sistemas de detecção de objetos que afetam a segurança em veículos autônomos.
― 6 min ler
MaxLin melhora a precisão e eficiência da verificação do CNN para aplicações de IA mais seguras.
― 7 min ler
Um novo sistema resolve possíveis problemas nas regras de acionamento em IoT para casas inteligentes.
― 7 min ler
Novas estratégias melhoram o aprendizado por reforço profundo contra ruído adversarial.
― 8 min ler
Analisando os riscos e as medidas de segurança na adaptação de modelos de linguagem.
― 6 min ler
Explorando como a neurociência cognitiva pode melhorar a compreensão dos modelos de IA.
― 9 min ler
Um novo conjunto de benchmarks ajuda a avaliar atalhos de raciocínio na inteligência artificial.
― 8 min ler
Um jeito novo de testar a segurança de modelos de linguagem e as habilidades multilíngues.
― 9 min ler
Pesquisadores desenvolvem novos métodos para treinar robôs com segurança em ambientes arriscados.
― 5 min ler
A pesquisa destaca o papel dos neurônios de segurança em melhorar a segurança e a responsabilidade dos LLMs.
― 7 min ler
Uma nova abordagem pra melhorar a segurança do modelo através da rejeição de previsões.
― 7 min ler
A pesquisa sobre ilhas magnéticas melhora a estabilidade do plasma e ajuda a prevenir interrupções em tokamaks.
― 7 min ler
Este artigo discute métodos para melhorar o alinhamento da IA com várias culturas.
― 8 min ler
Um novo método ajuda a identificar rapidamente os pontos fracos em modelos de aprendizado profundo.
― 6 min ler
Pesquisas mostram que modelos de linguagem têm dificuldade com raciocínio falso, levantando preocupações sobre segurança.
― 6 min ler