Simple Science

La science de pointe expliquée simplement

Que signifie "Retour de traduction"?

Table des matières

La rétro-traduction est une méthode utilisée pour améliorer la sécurité et la précision des modèles de langue. Ça consiste à prendre une réponse générée par un modèle de langue et à remonter le fil pour deviner le prompt original qui a conduit à cette réponse.

Comment ça marche

  1. Un modèle de langue donne une réponse basée sur une question ou un prompt spécifique.
  2. La rétro-traduction prend cette réponse et essaie de deviner quelle pourrait être la question originale.
  3. Cette question devinée s'appelle le prompt rétro-traduit. Ça aide à clarifier l'intention derrière le prompt original, montrant ce que l'utilisateur pourrait vraiment vouloir.

But

Le principal objectif de la rétro-traduction est de protéger les modèles de langue des demandes nuisibles que les gens pourraient essayer de cacher en changeant les mots. En utilisant la rétro-traduction, le modèle peut reconnaître si un prompt essaie de poser une demande dangereuse et refuser d'y répondre.

Avantages

  • Meilleure protection : Ça aide les modèles de langue à éviter les demandes nuisibles mieux que d'autres méthodes.
  • Qualité : La méthode n'affecte pas la qualité des réponses sûres, garantissant que le modèle fonctionne toujours bien pour les questions normales.

Derniers articles pour Retour de traduction