BLOG

Comment et pourquoi réaliser une bonne taxonomie des données ?

En biologie, la notion de taxonomie renvoie à la distribution des espèces vivantes dans des groupes hiérarchisés. Dans le domaine de l’IT, le terme a finalement un sens analogue : il renvoie à une instance de classification et hiérarchisation de l’ensemble des données de référence, celles qui sont indispensables à l’activité (produits, clients, fournisseurs).

Bien structurée et complète, elle rend la collecte et la diffusion de la donnée fluide et opérable. En ce sens, il paraît logique qu’une bonne taxonomie soit essentielle pour une bonne gouvernance des données. CENISIS donne les clés d’une classification optimale des données. Explications.

La taxonomie appliquée aux data : quezako ? 

De quoi parle-t-on ?

La taxonomie est une classification des données en catégories et sous-catégories. Elles sont ainsi ordonnées en structure hiérarchique puis compartimentées et enfin divisées en différents attributs.

L’échelle du monde animal a de même été classifiée par sous-ensembles  :

 

Source : Le café des sciences

 

Cette approche concerne l’ensemble des entreprises dès lors qu’elles collectent des données. La taxonomie évolue en permanence au gré des innovations, développements de nouvelles gammes ou même des nouvelles embauches. Ainsi, la plus grosse difficulté est de continuer à faire évoluer cette classification, sans pour autant altérer l’existant.

Les 4 bénéfices clés d’une bonne taxonomie des données

Faire une bonne taxonomie est essentiel pour les entreprises désireuses d’exploiter leurs données avec un bon niveau de qualité, d’accessibilité ou encore de sécurité. Pour ainsi dire, ce type de classification offre de nombreux avantages : 

  • Elle donne un langage commun et assure des niveaux de regroupement ou de détails partagés par tous les utilisateurs. La définition d’une taxonomie commune lève toute erreur de compréhension ou d’interprétation de la part des utilisateurs de la donnée.
  • Elle facilite l’accès aux données en rendant possible la recherche par catégories ou sous-catégories. Par exemple, appliquée au service paie, elle fluidifie l’établissement des fiches de paie ou même la réalisation des déclarations aux URSSAF. Grâce à la taxonomie, il est facile de savoir le niveau de cotisation applicable, selon que  l’employé dispose d’un statut cadre ou salarié.

 

  • En facilitant la recherche des informations, elle contribue à identifier et éliminer les informations ROT (redondantes, obsolètes, triviales) existantes. Cela réduit le risque de stockage de données non conformes aux exigences qualité.

 

  • Dans le cas où la taxonomie comporte des critères liés à la sécurité (ex : critique, sensible, confidentiel), elle simplifie l’analyse de risques et améliore la sécurité des données et le respect de la réglementation comme le RGPD qui encadre le partage et le stockage de certaines informations. L’entreprise doit être en mesure de savoir quelles sont les données sensibles, qui peut y accéder et les modifier ou encore où elles sont stockées.

Les étapes indispensables à la définition d’une bonne taxonomie

Démarrer par une approche structurée et consensuelle

Avant de se lancer dans la définition d’une taxonomie, il est nécessaire de structurer son approche. Ainsi, différentes étapes sont à mettre en œuvre. La priorité est de définir les objectifs et les usages de la classification (gestion, recherche, reporting). Puis, d’obtenir une définition consensuelle et objective des diverses catégories de la classification. Il faut ensuite déterminer le niveau de profondeur de la hiérarchie des données, le nombre de niveaux devant correspondre au minimum utile (4 à 5 maximum) et rester simples et globaux.

Reprenons l’exemple de notre service paie : sa taxonomie sera établie suivant les  informations qui lui sont essentielles pour établir les salaires : 

  • service (marketing, comptable, informatique…), 
  • niveau hiérarchique (cadre, salarié…) 
  • coefficient
  • position…

Une fois que les catégories sont définies, une définition claire, objective et transverse est attribuée à chaque niveau. Il est d’ailleurs conseillé d’utiliser autant que possible des standards existants pour faciliter la compréhension et favoriser les échanges (ex : déclaration fiscale, publication de fiches Produits) avec les partenaires extérieurs (ex : administration fiscale, fournisseurs, clients…).

Enfin, les entreprises doivent identifier les propriétaires de la taxonomie. Ils sont responsables de sa maintenance et de son évolution, de la qualité, de l’intégrité et de l’accessibilité des données classées.

Rédiger, nettoyer, mettre en application 

Une fois le cadre stratégique de la taxonomie posé, vient l’étape opérationnelle de formalisation et rédaction de ce qui compose la taxonomie :

  • en s’appuyant sur les définitions posées, réalisant une liste exhaustive des valeurs de chaque niveau tout en prenant garde à ne pas en avoir deux identiques. 
  • en évitant les catégories dites “fourre-tout” comme “autres” ou même “divers” qui ne permettent pas d’identifier clairement et de façon précise les données classées.

Les entreprises seront aussi amenées à nettoyer les doublons ou les données obsolètes. En effet, la taxonomie étant vouée à évoluer, il paraît logique de devoir, à terme, purifier les données qui ne seront plus d’actualités ou même en redondance.

Si l’on reprend l’exemple de notre service paie, un collaborateur peut être amené à figurer dans 2 services différents. Comment ? Si celui-ci évolue dans l’entreprise et passe d’un service comptabilité à un service financier. Dans la classification, sa “valeur” est alors présente dans les 2 secteurs. Il faudra introduire dans ce cas une distinction des 2 valeurs (période de validité, archivage de l’information passée ou suppression de l’information obsolète) afin de conserver l’information la plus actuelle et pertinente.

Pourquoi faire appel à un prestataire externe ?

Unifier des visions différentes de la data

Chaque entreprise, chaque service a sa propre organisation. La difficulté est alors de consolider des visions différentes des data utiles. Par exemple, le service comptabilité et le service marketing peuvent avoir des visions différentes des familles de produits qui sont commercialisées. Idem du côté d’un service comptabilité et d’un service paie qui ont chacun leur définition du statut
hiérarchique ou de la position d’un employé.

CENISIS, forte de ses expériences dans le domaine, met en évidence ces divergences et aide les organisations à construire un modèle commun, un référentiel de données unique. Celui-ci alimente ensuite durablement l’intégration et la classification de nouvelles données dans l’entreprise. 

Déployer une méthodologie unique

Pour définir une bonne taxonomie, notre méthodologie chez CENISIS repose sur une série de plusieurs ateliers, mise en place en collaboration avec nos clients. L’occasion d’aligner les enjeux data sur la stratégie de l’entreprise, d’identifier et de définir celles qui sont structurantes, puis d’organiser la classification par une taxonomie utile et fiable.

Une méthodologie qui a fait ses preuves pour mettre la gouvernance de données sur de bons rails ! 

Ainsi, taxonomie et data gouvernance sont de véritables alliés, la première ne pouvant subsister sans la seconde. Une politique de classification des données est donc essentielle pour améliorer leur qualité et leur pérennité. C’est le point de départ pour réussir une stratégie Data Driven où les données occupent une place déterminante. 

par Magali, Data Steward