Malgré l’adoption croissante des data catalogs, l’accès à la connaissance data reste un défi majeur pour les organisations. Si ces outils facilitent l’inventaire et la structuration des actifs data, ils peinent encore à rendre l’information réellement exploitable par les métiers.
Selon l’étude Dresner Advisory Research 2025, 62 % des utilisateurs rencontrent des difficultés pour trouver les informations data dont ils ont besoin. À l’heure de la généralisation de la BI et de l’essor de l’IA générative, simplement centraliser la connaissance ne suffit plus. L’enjeu a toujours été de collecter cette connaissance pour la rendre exploitable ; ce qui évolue aujourd’hui, c’est la manière d’y parvenir. Il ne suffit plus de stocker et documenter les métadonnées : elles doivent être diffusées de manière contextualisée, directement là où la donnée est utilisée, afin de soutenir des décisions réellement pilotées par la data.
Data Catalogs : pratiques mais isolés

Dans leur usage courant, les data catalogs sont vus et utilisés comme des outils de collecte et de centralisation de métadonnées. Ils permettent de référencer la liste des tables, des colonnes associées et de tout type d’asset technique manipulant la donnée comme des rapport BI. Ils peuvent également permettre de tracer le linéage du parcours de la donnée dans le SI, quel que soit l’environnement.
Cependant, cette information reste souvent organisée en silos fonctionnels :
- le data dictionary décrit la structure technique,
- le data glossary porte les définitions métier,
- les usages et rapports BI sont référencés séparément.
Si les data catalogs relient déjà une partie des éléments via le linéage, le lien avec les définitions métier repose encore largement sur des connexions créées manuellement. Les Data Stewards jouent alors un rôle clé pour maintenir la cohérence entre données et compréhension métier, mais cette connaissance reste souvent confinée dans le catalogue.
Et dès qu’il faut changer d’outil pour accéder à une définition ou à du contexte, l’expérience devient frictionnelle, ce qui freine l’adoption au quotidien.
Repenser le rôle du Data Catalog dans la gestion de la connaissance data
Les tendances Data & Analytics 2025 confirment une évolution profonde du rôle des data catalogs. Selon Gartner, les solutions de gestion des métadonnées doivent désormais couvrir l’ensemble du pipeline data, depuis les sources brutes jusqu’aux dashboards et APIs consommées par les utilisateurs.
Cette évolution repose sur trois transformations structurantes.
1. Un périmètre de connaissance data élargi
Les métadonnées ne se limitent plus à des informations techniques. Elles englobent désormais des éléments fonctionnels essentiels à la compréhension et à l’usage de la donnée, notamment :
- les définitions métier,
- les règles de calcul,
- l’ownership et les responsabilités,
- les tags et classifications,
- le contexte d’usage des données.
Le data catalog devient ainsi un socle de connaissance reliant données techniques et langage métier.
2. De la collecte à l’usage effectif de la connaissance
La valeur d’un data catalog ne réside pas uniquement dans la collecte ou le stockage des métadonnées. Collecter sans rendre exploitable n’apporte pas de valeur opérationnelle.
Pour soutenir les usages, les métadonnées doivent :
- être capturées au plus près des sources,
- être enrichies par les métiers,
- être accessibles directement dans les environnements de consommation :
- outils de BI,
- tables et produits data,
- APIs et services exposés.
L’objectif n’est pas de documenter pour documenter, mais de permettre un usage réel et immédiat de la donnée.
3. Du catalogue unique à un modèle distribué
Enfin, le modèle du data catalog unique montre ses limites dans des organisations de plus en plus distribuées.
La connaissance data doit désormais :
- s’appuyer sur des référentiels interconnectés,
- rester proche des équipes qui produisent et consomment la donnée,
- tout en garantissant une cohérence globale.
Cette approche s’inscrit dans la continuité des principes du data mesh, où la gouvernance et la connaissance data sont intégrées aux domaines et orientées vers les usages
Contextualiser les données : clé pour les consommateurs des données et pour l’IA

Prenons un exemple simple, très fréquent en entreprise. Un indicateur aussi basique que le chiffre d’affaires doit pouvoir être retrouvé facilement via une recherche “chiffre d’affaires” ou “CA”. Pourtant, dans certains environnements, aucune correspondance ne remonte, car l’indicateur est en réalité stocké sous un nom de champ technique du type “XRT57”.
Ce type de situation illustre un problème structurel : dans de nombreux systèmes, les noms de champs restent cryptiques, hérités, et souvent incohérents d’un applicatif à l’autre. Sans informations de contexte accessibles au plus près des données, le sens devient difficile à retrouver et la donnée perd en exploitabilité.
Avec l’arrivée des IA génératives capables d’interroger les données en langage naturel, l’enjeu devient encore plus critique. Une IA ne peut pas interpréter correctement “XRT57” sans métadonnées fiables. Elle a besoin de descriptions, définitions et règles de calcul directement accessibles dans les outils de consommation, et pas uniquement dans un catalogue séparé.
Est-ce la fin du Data Catalog ?
Non. Mais c’est la fin de l’idée selon laquelle le data catalog serait le centre unique de la connaissance data.
Le data catalog conserve un rôle clé pour :
- rechercher rapidement une définition,
- embarquer les métiers non techniques,
- visualiser le linéage,
- orchestrer l’ownership et la gouvernance
En revanche, il ne peut plus être le seul point d’accès à la connaissance. La donnée doit être intelligible là où elle est consommée, que ce soit par des utilisateurs humains ou par des IA génératives, incapables d’interpréter des champs techniques sans métadonnées contextualisées.
Le data catalog ne disparaît donc pas, mais il ne suffit plus. La valeur de la donnée émerge lorsque la connaissance circule, s’intègre aux pipelines et devient accessible directement dans les outils et usages du quotidien.
C’est précisément dans cette dynamique que s’inscrit la montée en puissance des Data Marketplaces : des plateformes d’accès à la donnée qui ne se limitent pas à référencer les actifs, mais intègrent également la gestion des métadonnées, les règles de gouvernance, l’ownership et les usages. L’objectif n’est plus seulement de documenter la donnée, mais de la rendre consommable, fiable et activable, au bon endroit, au bon moment.
Les experts Cenisis conseillent et accompagnent les entreprises à développer leur stratégie data grâce à un usage éclairé, maitrisé et outillé de leur patrimoine de données. Nos consultants vous accompagnent sur les enjeux Data d’aujourd’hui et de demain. Cenisis anticipe et accentue les perpétuelles évolutions des marchés, des technologies, ainsi que les nouvelles aspirations des citoyens et collaborateurs. Découvrez dès à présent notre approche.