MLOps
Qu'est-ce que les données synthétiques ? Définition (IA)
Définition des données synthétiques : des données générées artificiellement qui imitent des données réelles, pour entraîner ou tester un modèle sans exposer de données sensibles.
25 juin 20261 min
Image de couverture
Les données synthétiques sont des données générées artificiellement — par un modèle ou un algorithme — qui reproduisent les propriétés statistiques de données réelles, sans en être la copie.
Elles servent à entraîner ou tester un modèle quand les données réelles sont rares, coûteuses ou sensibles (RGPD). Bien conçues, elles préservent la confidentialité tout en gardant l'utilité analytique — un atout pour les secteurs régulés.
→ Préparer la donnée pour l'IA : expertise data engineering.