GLOSSAIRE
Glossaire de
l'intelligence artificielle.
30 termes essentiels pour comprendre l'IA en entreprise. Définitions claires, sans jargon inutile — pour décideurs, chefs de projet et équipes techniques.
A
Agent IA
Programme autonome qui utilise un LLM pour planifier et exécuter des actions en fonction d'un objectif. Contrairement à un chatbot, un agent IA peut appeler des outils, interroger des bases de données, déclencher des workflows et prendre des décisions intermédiaires sans intervention humaine.
B
Base de données vectorielle
Base de données optimisée pour stocker et rechercher des vecteurs d'embeddings à haute dimension. Permet la recherche par similarité sémantique en millisecondes, même sur des millions de documents. Exemples : Qdrant, Pinecone, Weaviate, pgvector.
C
Chain-of-Thought (CoT)
Technique de prompting qui encourage le LLM à détailler son raisonnement étape par étape avant de donner sa réponse finale. Améliore significativement la précision sur les tâches de raisonnement, de calcul et d'analyse complexe.
Computer Vision
Domaine de l'IA qui permet aux machines d'interpréter des images et des vidéos. Applications : contrôle qualité visuel en industrie, OCR intelligent, détection d'anomalies, reconnaissance d'objets. Les modèles multimodaux (GPT-4V, Claude Vision) combinent vision et langage.
D
Data Engineering
Discipline qui conçoit et maintient les pipelines de données alimentant les systèmes IA. Inclut l'ingestion, la transformation, le stockage et la qualité des données. Sans data engineering solide, aucun projet IA ne tient en production.
Deep Learning
Sous-ensemble du Machine Learning utilisant des réseaux de neurones profonds (nombreuses couches). Les architectures transformer, CNN et RNN sont des exemples de deep learning. Responsable des percées récentes en NLP, computer vision et IA générative.
E
Embeddings
Représentation numérique d'un texte, d'une image ou d'un concept sous forme de vecteur dense. Les embeddings capturent le sens sémantique : deux textes similaires auront des vecteurs proches. Ils sont la base de la recherche sémantique, du RAG et des systèmes de recommandation.
F
Fine-tuning
Processus d'adaptation d'un modèle pré-entraîné à un domaine ou une tâche spécifique en le ré-entraînant sur un jeu de données ciblé. Le fine-tuning permet d'améliorer la précision, d'adopter un style ou un vocabulaire métier, tout en conservant les capacités générales du modèle.
G
Grounding
Technique qui ancre les réponses d'un LLM dans des données factuelles vérifiables. Le grounding connecte le modèle à des sources de vérité (bases de données, documents, API) pour réduire les hallucinations et augmenter la fiabilité des réponses.
H
Hallucination
Phénomène où un LLM génère des informations factuellement incorrectes avec un haut degré de confiance. Les hallucinations sont le principal risque des applications IA en production. Le RAG, le grounding et la vérification factuelle sont les principales stratégies de mitigation.
I
IA générative
Branche de l'intelligence artificielle capable de créer du contenu original : texte, images, code, audio, vidéo. Basée sur des modèles génératifs (transformers, diffusion), elle transforme la production de contenu, l'automatisation et l'aide à la décision en entreprise.
Inférence
Phase d'utilisation d'un modèle IA entraîné pour produire des prédictions ou des réponses. En production, l'optimisation de l'inférence (latence, coût, débit) est critique. Techniques : quantization, batching, caching, modèles distillés.
L
LLM (Large Language Model)
Modèle de langage de grande taille entraîné sur des milliards de tokens. Les LLM (GPT-4, Claude, Mistral, Llama) génèrent du texte, analysent des documents et raisonnent sur des problèmes complexes. Ils sont la brique fondamentale des applications d'IA générative.
LoRA (Low-Rank Adaptation)
Technique de fine-tuning efficiente qui ne modifie qu'une petite fraction des paramètres du modèle. LoRA réduit considérablement les besoins en GPU et en données tout en obtenant des résultats comparables à un fine-tuning complet. Très utilisé pour adapter des LLM open-source.
M
Machine Learning
Sous-domaine de l'intelligence artificielle où les systèmes apprennent à partir de données sans être explicitement programmés. Inclut l'apprentissage supervisé (classification, régression), non supervisé (clustering) et par renforcement. Base de la majorité des systèmes IA modernes.
MCP (Model Context Protocol)
Protocole ouvert qui standardise la connexion entre les agents IA et les outils externes (API, bases de données, fichiers). MCP permet aux LLM d'accéder à des données en temps réel et d'exécuter des actions de manière sécurisée et structurée.
MLOps
Ensemble de pratiques qui unifient le développement ML (Machine Learning) et les opérations. Inclut le versioning des modèles, le CI/CD des pipelines ML, le monitoring en production, la détection de drift et le retraining automatique. Indispensable pour maintenir des modèles IA en production.
Monitoring IA
Surveillance continue des modèles IA en production : qualité des réponses, latence, coûts, détection de drift (dégradation progressive). Outils spécialisés : LangFuse, LangSmith, Helicone. Indispensable pour maintenir la fiabilité d'un système IA dans le temps.
N
NER (Named Entity Recognition)
Tâche de NLP qui consiste à identifier et classifier les entités nommées dans un texte : personnes, organisations, lieux, dates, montants. Essentiel pour l'extraction automatique d'informations dans les documents métier.
NLP (Natural Language Processing)
Traitement automatique du langage naturel. Ensemble de techniques permettant aux machines de comprendre, analyser et générer du langage humain. Inclut la classification de texte, l'extraction d'entités, l'analyse de sentiment, la traduction et la génération de résumés.
O
OCR (Optical Character Recognition)
Reconnaissance optique de caractères. Technologie qui convertit des images de texte (scans, photos, PDF) en texte exploitable par machine. L'OCR intelligent (avec IA) comprend la structure des documents, les tableaux et les formulaires.
Orchestration IA
Coordination de plusieurs composants IA (LLM, outils, bases de données, API) dans un workflow structuré. L'orchestration gère le séquencement des appels, la gestion d'erreurs, les retries et le routage conditionnel. Outils : LangGraph, Temporal, Inngest.
P
Prompt engineering
Discipline de conception des instructions (prompts) données à un LLM pour obtenir des résultats précis et fiables. Inclut des techniques comme le few-shot, le chain-of-thought, le system prompt structuré et le prompt templating. Compétence clé pour exploiter les LLM en production.
Q
Quantization
Technique de compression qui réduit la précision numérique des paramètres d'un modèle (ex : de 16-bit à 4-bit). Diminue la taille du modèle et accélère l'inférence avec une perte de qualité minimale. Essentiel pour déployer des LLM sur du matériel limité ou réduire les coûts.
R
RAG (Retrieval-Augmented Generation)
Architecture qui combine recherche documentaire et génération de texte. Le système retrouve les passages pertinents dans une base de connaissances (via embeddings et recherche vectorielle), puis les injecte dans le prompt du LLM pour produire une réponse factuelle et sourcée. Essentiel pour réduire les hallucinations.
S
Système multi-agents
Architecture où plusieurs agents IA collaborent pour résoudre un problème complexe. Chaque agent a un rôle spécialisé (recherche, analyse, rédaction, validation) et ils communiquent via un protocole défini. Permet de décomposer des tâches impossibles pour un seul agent.
T
Token
Unité de base utilisée par les LLM pour traiter le texte. Un token correspond approximativement à un mot ou une partie de mot (en français, ~1 token pour 0.7 mot). Le nombre de tokens détermine le coût d'un appel API et la longueur maximale de contexte du modèle.
Transformer
Architecture de réseau de neurones introduite en 2017, basée sur le mécanisme d'attention. Les transformers sont à la base de tous les LLM modernes (GPT, Claude, Mistral, Llama). Leur capacité à traiter des séquences longues en parallèle a révolutionné le NLP.
COMMENCER
Un projet IA en vue ?
Ces termes prennent vie dans vos systèmes. Parlons de votre cas d'usage — 30 minutes pour identifier les opportunités.
Appel de 30 min → Audit gratuit → Proposition sous 24 heures.