Jakob Foerster

Négociation et microstructure des marchés Modéliser le flux d'ordres sur les marchés financiers avec l'IA

Cet article parle d'une nouvelle approche d'IA générative pour modéliser le flux de commandes sur les marchés financiers.

2025-09-28T18:11:23+00:00 ― 6 min lire

Négociation et microstructure des marchés Le rôle des simulateurs de carnet d'ordres à haute fréquence avec GPU dans les marchés financiers

Découvre comment des simulateurs avancés transforment les stratégies de trading et l'analyse de marché.

2025-09-26T22:55:40+00:00 ― 9 min lire

Informatique et théorie des jeux Naviguer dans les défis de l'apprentissage multi-agent

Un aperçu de l'apprentissage multi-agents et des stratégies pour mieux coopérer.

2025-09-12T16:36:48+00:00 ― 8 min lire

Apprentissage automatique Améliorer l'apprentissage dans les jeux multi-agents

Explorer de nouvelles méthodes pour de meilleurs résultats d'apprentissage dans les jeux multijoueurs.

2025-09-09T20:32:30+00:00 ― 7 min lire

Apprentissage automatique Améliorer le travail d'équipe de l'IA grâce à des augmentations de rupture de symétrie

Une nouvelle méthode améliore l'adaptabilité de l'IA en équipe en diversifiant les comportements d'entraînement.

2025-09-07T18:30:30+00:00 ― 9 min lire

Apprentissage automatique Avancées dans les modèles de mémoire pour l'apprentissage par renforcement

De nouveaux modèles de mémoire améliorent l'efficacité des processus d'entraînement en apprentissage par renforcement.

2025-09-07T17:43:06+00:00 ― 7 min lire

Apprentissage automatique Présentation de Craftax : Un benchmark amélioré pour l'apprentissage par renforcement

Craftax propose un environnement challenging pour tester les algos RL de manière efficace.

2025-09-03T22:04:42+00:00 ― 9 min lire

Apprentissage automatique Avancées dans l'apprentissage par renforcement hors ligne avec diffusion guidée par politique

Une nouvelle méthode améliore les données d'entraînement pour l'apprentissage par renforcement hors ligne.

2025-08-21T01:05:36+00:00 ― 8 min lire

Apprentissage automatique Présentation de DEXTER : Une nouvelle méthode pour la détection OOD

DEXTER améliore la sécurité de l'IA en renforçant la détection des données hors distribution.

2025-08-20T18:22:42+00:00 ― 8 min lire

Apprentissage automatique L'avenir de l'IA générative open source

Explorer l'utilisation responsable de la technologie de l'IA générative dans différents domaines.

2025-08-16T14:18:42+00:00 ― 10 min lire

Apprentissage automatique L'IA apprend du comportement humain : une nouvelle approche

Utiliser la valeur d'échange pour apprendre à l'IA des comportements sûrs et efficaces des humains.

2025-08-13T12:58:24+00:00 ― 8 min lire

Calcul et langage PARDEN : Une nouvelle approche pour la sécurité des modèles linguistiques

PARDEN améliore la sécurité dans les modèles de langage contre les réponses nuisibles.

2025-08-11T12:15:24+00:00 ― 9 min lire

Apprentissage automatique Les promesses et les dangers de l'IA générative open-source

Examiner les risques et les opportunités de la technologie d'IA générative open source.

2025-08-11T04:13:30+00:00 ― 7 min lire

Apprentissage automatique Avancées dans la Distillation de Comportement pour l'Apprentissage par Renforcement

Une nouvelle méthode améliore l'entraînement des modèles en créant des jeux de données synthétiques efficaces.

2025-07-25T17:21:24+00:00 ― 11 min lire

Apprentissage automatique Faire progresser l'apprentissage par renforcement profond avec des mélanges d'experts

Comment les mélanges d'experts améliore la performance dans les tâches d'apprentissage par renforcement profond.

2025-07-23T23:21:18+00:00 ― 6 min lire

Théorie de l'information Faire avancer les couplages à faible entropie avec ARIMEC

Une nouvelle méthode améliore l'efficacité des couplages à faible entropie pour de grandes distributions.

2025-07-22T06:40:12+00:00 ― 7 min lire

Intelligence artificielle IA dans la recherche scientifique : un nouvel outil

L'IA montre du potentiel pour automatiser le processus de recherche scientifique.

2025-06-29T03:02:12+00:00 ― 10 min lire

Apprentissage automatique Avancées dans les modèles de mélange d'experts avec BAM

BAM améliore l'efficacité de MoE en intégrant les paramètres d'attention et de FFN.

2025-06-27T12:35:24+00:00 ― 6 min lire

Apprentissage automatique Minimiser le regret dans les environnements d'entraînement en apprentissage par renforcement

Cet article explore des méthodes d'entraînement efficaces pour les agents d'apprentissage par renforcement afin de réduire le regret.

2025-06-21T11:05:54+00:00 ― 7 min lire

Intelligence artificielle Simuler l'évolution de l'intelligence chez des agents virtuels

Un nouveau simulateur fait évoluer des agents capables de culture et de raisonnement.

2025-06-19T01:09:54+00:00 ― 8 min lire

Apprentissage automatique L'IA apprend à bosser ensemble dans le chaos

Des chercheurs ont développé une méthode pour que l'IA puisse se coordonner sans avoir toutes les infos.

2025-05-28T14:26:42+00:00 ― 7 min lire

Apprentissage automatique Grokking : Le Tournant dans l'Apprentissage Automatique

Explore comment les réseaux de neurones passent de la mémorisation à une vraie compréhension.

2025-03-18T07:40:21+00:00 ― 8 min lire

Apprentissage automatique Adapter l'apprentissage par renforcement aux environnements changeants

De nouvelles techniques améliorent l'efficacité d'apprentissage des agents IA quand les environnements changent.

2025-02-08T00:47:40+00:00 ― 8 min lire