Qu'est-ce que le RLHF ? Définition (IA)

Définition du RLHF (Reinforcement Learning from Human Feedback) : une méthode qui affine un modèle d'IA à partir de retours humains, pour le rendre plus utile et aligné.

25 juin 20261 min

Image de couverture

Le RLHF (Reinforcement Learning from Human Feedback) est une technique d'entraînement qui affine un modèle d'IA à partir de préférences humaines, pour le rendre plus utile, sûr et aligné avec les attentes.

Des humains classent ou notent les réponses du modèle ; ces retours servent à l'orienter vers des sorties plus pertinentes et moins problématiques. C'est l'une des méthodes qui ont rendu les LLM modernes (comme ChatGPT ou Claude) utilisables au quotidien.

→ Comprendre les LLM : qu'est-ce qu'un LLM.

Prêt à déployer un pod chez vous ?

Parler à un expert Voir le modèle

À lire ensuite

Prêt à déployer un pod chez vous ?