Que signifie "Dans la distribution"?
Table des matières
"In-distribution" fait référence aux données qu'un modèle d'apprentissage automatique a déjà vues pendant son entraînement. Par exemple, si un modèle est entraîné à reconnaître des chats en utilisant des photos de chats provenant de sources spécifiques, ces photos sont considérées comme "in-distribution". Le modèle fonctionne bien quand il reçoit des images similaires parce qu'il a appris des motifs et des caractéristiques à partir de ces exemples.
Quand un modèle est testé sur des données qu'il n'a pas rencontrées, on parle de données "out-of-distribution". Ça peut inclure des images de chats qui viennent de sources différentes, qui ont des arrière-plans différents, ou qui varient en qualité. Le défi est de savoir comment le modèle peut reconnaître ces nouvelles images en fonction de son apprentissage précédent avec les données in-distribution.
En général, on s'attend à ce que les modèles fonctionnent mieux sur les données in-distribution puisqu'ils sont conçus pour reconnaître les motifs de cet ensemble. Cependant, des problèmes peuvent survenir, comme lorsque le modèle se laisse distraire par des détails inutiles dans les images, ce qui peut entraîner des erreurs lors de la classification des données out-of-distribution.
Comprendre la différence entre in-distribution et out-of-distribution est essentiel pour améliorer la précision et la fiabilité des modèles d'apprentissage automatique.