Combiner la détection OOD et la prédiction conforme améliore la fiabilité du modèle.
― 7 min lire
La science de pointe expliquée simplement
Combiner la détection OOD et la prédiction conforme améliore la fiabilité du modèle.
― 7 min lire
Apprends comment décomposer des tâches complexes aide les robots à naviguer efficacement.
― 6 min lire
Un nouveau jeu de données évalue comment les modèles de langage gèrent le contenu nuisible à travers les cultures.
― 7 min lire
Un aperçu de comment les réseaux de neurones traitent l'information et leurs implications.
― 5 min lire
Une nouvelle approche pour l'analyse de sécurité en utilisant des fonctions de barrière stochastiques par morceaux.
― 9 min lire
Une méthode pour entraîner des robots à des tâches complexes tout en garantissant la sécurité.
― 9 min lire
Une nouvelle méthode améliore la sécurité dans la portée en haute dimension pour les véhicules autonomes.
― 7 min lire
Utiliser la valeur d'échange pour apprendre à l'IA des comportements sûrs et efficaces des humains.
― 8 min lire
Une nouvelle méthode pour améliorer l'estimation de l'incertitude dans les modèles d'IA pour les appareils edge.
― 10 min lire
Une nouvelle méthode améliore la sécurité de conduite des robots tout en augmentant leur vitesse d'apprentissage.
― 7 min lire
Présentation d'une méthode innovante pour améliorer l'entraînement des robots et leur sécurité.
― 10 min lire
Cet article parle de la conception de contrôleurs de réseaux de neurones sûrs pour des systèmes critiques.
― 8 min lire
Cet article parle d'améliorer les CNN en utilisant des informations basse fréquence pour être plus résilients face aux attaques adversariales.
― 8 min lire
Explorer les contraintes de préjudice contrefactuel pour une prise de décision plus sûre dans l'IA.
― 8 min lire
Le bouclier prédictif dynamique améliore la sécurité et l'efficacité dans l'apprentissage par renforcement.
― 7 min lire
Une méthode pour améliorer la détection d'objets dans des environnements inconnus en utilisant un entraînement à source unique.
― 10 min lire
AdvUnlearn améliore la sécurité de la génération d'images en combinant le désapprentissage avec l'entraînement adversarial.
― 7 min lire
Cet article parle de nouvelles méthodes pour expliquer les décisions de l'IA dans la détection d'objets.
― 8 min lire
De nouvelles méthodes améliorent la détection des échantillons atypiques dans des environnements de données mixtes.
― 9 min lire
Cet article examine les risques d'ajuster les modèles de langage pour la sécurité.
― 5 min lire
Une nouvelle méthode permet aux agents de suivre les règles de sécurité en langage simple.
― 9 min lire
Cette étude explore l'utilisation de modèles plus petits pour améliorer la sécurité des systèmes d'IA.
― 8 min lire
Une nouvelle méthode pour que les agents optimisent leur performance tout en respectant les contraintes.
― 7 min lire
Cet article parle des méthodes de calibration essentielles pour les détecteurs d'objets dans des applications critiques.
― 8 min lire
Des recherches montrent des biais dans les systèmes de détection d'objets qui impactent la sécurité des véhicules autonomes.
― 7 min lire
MaxLin améliore l'exactitude et l'efficacité de la vérification CNN pour des applications IA plus sûres.
― 8 min lire
Un nouveau système s'attaque aux problèmes potentiels des règles d'action-déclenchement IoT pour les maisons intelligentes.
― 8 min lire
De nouvelles stratégies améliorent l'apprentissage par renforcement profond face au bruit adversarial.
― 8 min lire
Examiner les risques et les mesures de sécurité dans le réglage des modèles de langue.
― 7 min lire
Explorer comment les neurosciences cognitives peuvent améliorer la compréhension des modèles d'IA.
― 10 min lire
Une nouvelle suite de tests aide à évaluer les raccourcis de raisonnement dans l'intelligence artificielle.
― 8 min lire
Une nouvelle méthode pour tester la sécurité des modèles de langage et leurs compétences multilingues.
― 10 min lire
Des chercheurs développent de nouvelles méthodes pour entraîner des robots en toute sécurité dans des environnements risqués.
― 5 min lire
La recherche met en avant le rôle des neurones de sécurité dans l'amélioration de la sécurité et de la responsabilité des LLM.
― 8 min lire
Une nouvelle approche pour améliorer la sécurité des modèles en rejetant les prédictions.
― 8 min lire
La recherche sur les îles magnétiques améliore la stabilité du plasma et prévient les disruptions dans les tokamaks.
― 8 min lire
Cet article aborde des méthodes pour améliorer l'alignement de l'IA avec diverses cultures.
― 9 min lire
Une nouvelle méthode aide à identifier rapidement les points faibles des modèles d'apprentissage profond.
― 7 min lire
Des recherches montrent que les modèles de langage ont du mal avec le raisonnement faux, ce qui soulève des préoccupations en matière de sécurité.
― 7 min lire
La recherche se concentre sur la gestion des disruptions de plasma pour améliorer la sécurité des réacteurs à fusion.
― 5 min lire