Open Knowledge Format (OKF) : rendre la connaissance de votre entreprise lisible par les agents IA
À l'ère des agents IA, la question n'est plus seulement « comment être trouvé », mais « comment être correctement compris par les machines ». Deux approches s'opposent : manipuler l'IA, ou structurer sa connaissance. Décryptage de l'Open Knowledge Format (OKF), le format ouvert de Google Cloud — et de la bonne façon de rendre son savoir consommable par les agents.
Les agents IA et les moteurs de réponse (ChatGPT, Claude, Perplexity, Google AI Overviews) sont devenus une porte d'entrée vers l'information. Pour une entreprise, une question stratégique émerge : comment ma connaissance est-elle lue, comprise et restituée par ces machines ?
Face à cette question, deux philosophies s'affrontent. L'une consiste à manipuler l'IA. L'autre à structurer sa connaissance pour qu'elle soit consommée proprement. Cet article explique pourquoi la seconde gagne sur la durée — et présente un standard concret qui l'incarne : l'Open Knowledge Format (OKF), publié par Google Cloud.
Deux façons de « parler aux IA »
La voie manipulatoire (court terme, fragile)
Une mode émerge : des sites placent des boutons « Analyser avec Claude / ChatGPT / Perplexity » pré-chargés avec un prompt caché. En cliquant, l'utilisateur lance, sans le voir, une consigne qui ordonne à l'IA d'utiliser tout ce qu'elle sait de lui pour produire une analyse… qui vend le service en question, et pré-remplit même un email commercial.
C'est astucieux. C'est aussi un détournement de confiance : on instrumentalise l'assistant de l'utilisateur et ses données personnelles à des fins de vente. Ça peut convertir à court terme. Mais sur des décideurs prudents — DSI, CTO, directions achats — ça envoie le signal inverse de celui qu'on veut : *« cette boîte manipule »*. Et les plateformes IA fermeront ces failles. C'est une tactique, pas une fondation.
La voie de l'ingénierie (durable)
L'alternative ne cherche pas à tromper l'IA, mais à lui donner une connaissance propre, structurée et vérifiable. L'idée : si votre savoir est correctement formaté, les agents et les LLM le citent et l'utilisent parce qu'il est fiable et lisible, pas parce que vous les avez piégés.
C'est exactement le problème que résout l'OKF.
Qu'est-ce que l'Open Knowledge Format (OKF) ?
L'Open Knowledge Format est un format ouvert et vendor-neutral, publié par Google Cloud, pour représenter la connaissance sous forme de simples fichiers markdown avec frontmatter YAML.
Le principe est volontairement minimaliste :
- Le frontmatter YAML porte les quelques champs structurés que l'on veut filtrer ou indexer (
type,resource,tags,timestamp). - Le corps markdown contient la prose, les schémas, les exemples — ce que les LLM et les humains lisent réellement.
- Les fichiers sont organisés en arborescence de dossiers, avec des
index.mdauto-générés pour naviguer un niveau à la fois. - Les concepts se relient entre eux par de simples liens markdown, formant un graphe de connaissance.
OKF n'est lié à aucun framework, modèle ou fournisseur. N'importe qui peut en produire (un humain, un agent LangChain ou Google ADK, un export depuis Dataplex, Unity Catalog, Collibra…) et n'importe quoi peut le consommer (un serveur de fichiers statique, Obsidian, Notion, MkDocs, un index de recherche, ou un LLM qui charge les fichiers en contexte).
Pourquoi OKF compte pour l'entreprise
Représenter sa connaissance en markdown + YAML versionné débloque des propriétés difficiles à obtenir avec un catalogue propriétaire fermé :
- Lisible par les humains ET les agents. Aucun SDK ni langage de requête entre le lecteur et le contenu. Un ingénieur fait
catsur un concept ; un LLM l'ingère verbatim dans son contexte. - Versionnable nativement. Les bundles vivent dans Git : pull requests, diffs ligne à ligne, revue. La curation de connaissance devient une activité d'ingénierie logicielle normale.
- Portable, sans lock-in. Un bundle, c'est un dossier. On l'héberge n'importe où, on le synchronise vers n'importe quel système qui parle « fichiers ». Aucune API propriétaire ne s'interpose entre vous et votre métadonnée.
- Structuré ET non structuré, à dessein. Frontmatter pour le peu qu'on veut requêter ; markdown pour ce que les LLM et les humains lisent vraiment.
- Divulgation progressive. Les
index.mdlaissent un agent naviguer la hiérarchie par paliers, au lieu de charger tout le bundle en contexte (et de saturer la fenêtre). - Orienté graphe. Les concepts se lient entre eux : on exprime des relations plus riches que le simple parent/enfant des dossiers.
Pour une ETI ou un grand groupe, c'est une réponse directe à une question centrale : comment faire en sorte que mes agents IA (et demain les moteurs externes) comprennent vraiment mon métier, mes données, mes règles ?
OKF, RAG, agents et MCP : la même bataille
L'OKF s'inscrit dans un mouvement de fond : rendre la connaissance d'entreprise consommable par les machines, proprement.
- En [RAG](/blog/rag-production-guide), la qualité des réponses dépend d'abord de la qualité et de la structure des sources. Un corpus OKF — markdown propre, frontmatter, liens — est un terrain idéal pour le chunking et le retrieval.
- Pour les [agents IA](/expertise/agents-ia), un agent n'est utile que s'il accède à une connaissance fiable. La divulgation progressive de l'OKF (
index.mdpar niveau) correspond exactement à la façon dont un agent doit explorer un savoir sans saturer son contexte. - Avec [MCP (Model Context Protocol)](/guides/mcp-server-entreprise), on connecte les agents aux outils et aux données. OKF est un format de connaissance qu'un serveur MCP peut exposer naturellement.
Le point commun : la valeur ne vient pas d'un tour de passe-passe marketing, mais d'une architecture de connaissance pensée pour être lue par des humains, des agents et des LLM à la fois.
Ce que ça change pour votre stratégie
- Traitez votre connaissance comme du code. Versionnée, revue, structurée. C'est la condition pour qu'un agent IA s'appuie dessus sans halluciner.
- Préférez les formats ouverts. Markdown + YAML (OKF, ou des conventions proches comme
llms.txtcôté visibilité) plutôt qu'un catalogue propriétaire fermé. Pas de lock-in, lisible par tout l'écosystème IA. - Construisez la confiance, pas la manipulation. Être cité et utilisé par les IA se gagne en rendant son savoir vérifiable et bien structuré — pas en piégeant l'assistant du prospect.
FAQ
Qu'est-ce que l'Open Knowledge Format (OKF) ? Un format ouvert et vendor-neutral, publié par Google Cloud, qui représente la connaissance sous forme de fichiers markdown avec frontmatter YAML. Objectif : une connaissance lisible à la fois par les humains, les agents IA et les LLM, versionnable dans Git et sans lock-in.
OKF remplace-t-il un catalogue de données (Dataplex, Collibra) ? Non, il le complète. OKF est un format d'export/échange : on peut générer un bundle OKF depuis un catalogue existant pour le rendre consommable par des agents et des LLM, sans remplacer l'outil de gouvernance.
Quel rapport entre OKF et le RAG ? Un corpus OKF (markdown structuré, frontmatter, liens) est une source de qualité pour un système RAG : il facilite le chunking, le retrieval et la traçabilité des réponses.
Faut-il utiliser Google ADK ou Gemini pour faire de l'OKF ? Non. Le dépôt de référence utilise Google ADK et Gemini pour la démo, mais le format lui-même est indépendant de tout framework ou modèle. On peut produire de l'OKF avec n'importe quel outil — y compris à la main.
Structurer votre connaissance pour l'IA avec Origin 137
Origin 137 est une ESN IA française et partenaire officiel d'Anthropic. Nous aidons les ETI et grands groupes à construire la couche de connaissance dont leurs agents IA ont besoin — RAG, MCP, formats ouverts — pour des systèmes fiables et traçables, pas des coups marketing.
Nos [Forward Deployed Engineers](/forward-deployed-engineers) s'embarquent dans vos équipes pour concevoir cette architecture de connaissance et la mettre en production, en transférant les compétences.
Réservez un appel découverte gratuit pour structurer la connaissance de vos agents IA.
Liens utiles :
Parlons de votre projet
Vous chiffrez un projet IA ?
Recevez une estimation adaptée à votre contexte — périmètre, stack, profils, budget. Appel de 30 min, gratuit, sans engagement.
Demander une estimationNEWSLETTER
Vous avez aimé cet article ?
Un email par mois avec nos meilleurs articles et retours de mission.
Appel de 30 min → Audit gratuit → Proposition sous 24 heures.