Engineering
Qu'est-ce que l'IA multimodale ? Définition
Définition de l'IA multimodale : un système capable de traiter et combiner plusieurs types de données — texte, image, audio, vidéo — au sein d'un même modèle.
25 juin 20261 min
Image de couverture
Une IA multimodale est un système capable de comprendre et de combiner plusieurs modalités de données — texte, image, audio, voire vidéo — dans un même modèle.
Concrètement, un modèle multimodal peut analyser une image et répondre à une question à son sujet, ou lire un document mêlant texte et schémas. C'est une avancée clé pour les cas d'usage entreprise mêlant documents, visuels et langage.
→ Voir nos expertises computer vision et IA générative.