54% des données détenues par les entreprises européennes sont inexploitées. Ce chiffre met en évidence la difficulté pour les responsables informatiques à comprendre ce qui se cache réellement au sein de leurs réseaux. Dans les 46% des données restantes, 32% sont redondantes, obsolètes ou triviales. Ce qui veut dire, encore, que seulement 14% des données sont critiques ou ont un intérêt business.
A l’origine de cette estimation, Veritas parle de gigantesque «databerg» de données inutiles à stocker et à traiter, mais aussi des données redondantes, obsolètes ou personnelles -des photos de vacances aux documents d’identité personnels. Cette lacune pourrait avoir, à long terme, un impact négatif sur la qualité des données !
En moyenne, donc, un tiers (32%) des données stockées par les entreprises n’ont aucune pertinence pour leur activité, mais elles deviennent une source de coût non négligeable.
Inversement, certaines données cruciales ne sont pas dupliquées et sont stockées sur des serveurs locaux. Elles sont alors inexploitables au niveau du groupe, ce qui est dommageable. D’où l’importance de mettre en œuvre une architecture cohérente, sécurisée et un processus de gestion de ces dark data afin de les rendre visibles et exploitables. Les entreprises doivent reprendre la main pour mettre en œuvre ces bonnes pratiques.
Dans cette démarche de gestion des dark data, tout le monde est concerné. La direction générale et toutes les directions métiers doivent prendre part à cette stratégie. Chacune doit insuffler à ses collaborateurs des comportements plus responsables vis-à-vis de la donnée. Elles doivent les inciter à les archiver et à les stocker selon un processus défini par l’entreprise afin de les rendre accessibles et exploitables.
Pour cela tout collaborateur doit être sensibilisé à l’importance de la valeur de la donnée pour le business de l’entreprise. Cette prise de conscience se fera d’autant plus facilement que le processus de gestion mis en place sera simple d’utilisation. En revanche, développer des solutions compliquées à mettre en œuvre et à utiliser aura tendance à inciter les utilisateurs à adopter un comportement individualiste de la gestion de la donnée et à en faire des dark data.