Le cycle de vie des données
Comme tout actif, les données possèdent un cycle de vie, et afin de gérer cet actif, les organisations doivent gérer le cycle de vie des données. Les données sont créée ou acquise, entreposée et entretenue, utilisée, et finalement détruite. Dans le cours de sa vie, une donnée peut être extraite, exportée, importée, migrée, validée, modifiée, mise à jour, nettoyée, transformée, convertie, intégrée, ségrégée, agrégée, référencée, examinée, rapportée, analysée, extraite, sauvegardée, récupérée, archivée, et récupérée avant d’être finalement supprimée.
Les données sont un fluide. Les flux de données entrant/sortant d’un entrepôt de données, sont conditionnées pour la livraison de produits d’informations. Les données sont conservées dans des SGBDs, fichiers plats, documents électroniques et dans de nombreux format moins structurés tels que des courriels et autres documents électroniques, documents papier, des feuilles de calcul, des rapports, des graphiques, des fichiers d’images électroniques, enregistrements audio et vidéo. En règle générale, 80% des données d’une organisation réside dans des formats relativement non structurées.
Une donnée possède une valeur quand elle est effectivement utilisée, ou peut être utile dans l’avenir. Toutes les étapes du cycle de vie des données ont des coûts et des risques, mais seulement l’étape de « l’utilisation » ajoute de la valeur à l’entreprise.
Lorsque gérées efficacement, le cycle de vie des données commence avant même l’acquisition des données. La gestion du cycle de vie des données débutera par la planification d’entreprise pour les données, la modélisation des données, la capture des données, la livraison, la conservation et les contrôles.
Les projets s’assurent que les spécifications et le déroulement des activités liées aux données ainsi qu’une partie de la planification des données soient menés. Le cycle de développement d’un système (SDLC), représenté sur la figure ci-dessous, n’est pas le même que le cycle de vie des données. Le SDLC décrit en fait les étapes d’un projet, alors que le cycle de vie des données décrit les processus qui sont exécutés pour gérer les actifs de données.
Cependant, les deux cycles de vie sont étroitement liés, car la planification des données, les spécifications et le déroulement des activités liées aux données font partie intégrante du SDLC. Les autres activités du SDLC sont de nature opérationnels ou de surveillance.