Pour tester votre consultant data, ou simplement pour enrichir votre vocabulaire dédié à la donnée, nous avons décidé de vous livrer un glossaire des termes à connaître absolument.
Dark data
Ces données sont souvent négligées, et pourtant si précieuses. D’après Gartner, les dark data sont l’ensemble des informations que les organisations collectent, traitent et stockent, mais qu’elles n’utilisent pas. Les entreprises pourraient découvrir de nouvelles opportunités si elles parvenaient à les exploiter.
Data lake
Littéralement traduit “lac de données”, le data lake est un référentiel de données permettant de stocker un très important volume de données brutes (dans leur format d’origine) pour une durée indéterminée. Les données structurées et non structurées se côtoient. C’est une méthode pertinente pour les entreprises qui ont besoin de stocker beaucoup de data. Encore faut-il pouvoir maîtriser ce type de stockage. Pour en savoir plus, nous vous invitons à revoir notre article à ce sujet : le Data Lake comme référentiel opérationnel, bonne idée ?
Data puking
Le data puking se défini comme une profusion de données. C’est le fait de disposer d’une multitude de data, de ne pas savoir les hiérarchiser, de ne pas en extraire la valeur et de vouloir absolument toutes les utiliser. Cela aboutit finalement à perdre du temps, perdre de vue les objectifs et ne donner aucun résultat concret. Gilles Fiolet, notre responsable des consultants, en parle très bien dans cette vidéo : du Data Puking au Data Storytelling.
Data pool
Le data pool est un espace de stockage de l’information, davantage structurée que le data lake. Les données sont organisées en Datamart (sous-ensembles de data warehouse). Ainsi, l’accès à tous les utilisateurs, même sans expertise data, est facilité.
Data sharing ou open data
Les open data (ou données ouvertes) sont des datas accessibles, utilisables et partageables par tout le monde. Selon la définition donnée par l’Open Knowledge Foundation, les critères caractérisant les open data sont les suivants :
- Disponibilité et accès : les données doivent être pleinement accessibles, leur forme doit être confortable et modifiable facilement.
- Réutilisation et redistribution : les conditions de mise à disposition des data doivent permettre leur réutilisation et leur redistribution et pouvant se mélanger avec d’autres données.
- Participation universelle : tout le monde doit être en mesure d’utiliser et de redistribuer les données, sans restrictions.
Certaines entreprises ou organismes publics, comme la SNCF ou l’INSEE mettent ainsi leurs données à disposition des acteurs économiques.
Chaîne de valeur data
La chaîne de valeur data désigne les données qui contribuent le plus à apporter de la valeur ajoutée à une entreprise. Il s’agit en clair des données qui assurent un avantage concurrentiel et qui présentent les meilleurs avantages en termes de coûts, de rendement et d’image. Définir la chaîne de valeur data permet de se centrer sur ces données pour les pérenniser.
Data utile (vs stupid data)
La donnée utile est celle qui a du sens et de l’impact pour votre activité. Ce sont les données qui sont indispensables à la chaîne de valeur de votre entreprise. Ce sont sur ces data que vous devez vous concentrer pour garantir une qualité et une fiabilité maximale de votre chaîne de valeur.
Au contraire la “stupid data” désigne les données inutiles sur lesquelles certaines entreprises dépensent du temps et de l’énergie afin de les utiliser, sans que cela ne donne de résultat efficace.
Self-service data (ou data discovery)
La data discovery permet à un utilisateur métier d’extraire et d’interpréter des données pouvant provenir de différentes sources. Cela permet de trouver, de visualiser et de raconter des faits autour des données, sans qu’aucun algorithme n’ait été paramétré au préalable.
Data for & from IoT
Ce sont toutes les données générées pour ou par l’Internet des Objets. Ces data méritent d’être exploitées, car elles sont utiles pour définir des tendances et fournissent des informations précieuses. Comme le nombre d’objets connectés ne cesse d’augmenter, il est donc nécessaire de disposer d’outils capables de gérer ces volumes de données.
Voilà une liste non exhaustive des tendances data d’aujourd’hui et de demain. Bien évidemment, ce glossaire est amené à évoluer avec le temps, mais il vous aidera dès aujourd’hui à mieux comprendre le jargon “data”.