Passer au contenu

Avec l’EIM, les données non structurées ne sont plus les oubliées des stratégies data

Lucien Guillermin
18 septembre 2023

Bien que constituant une large part du patrimoine de données, les données non structurées sont trop souvent négligées.

En unifier la gouvernance et les intégrer à sa stratégie data permet de mettre ce précieux gisement d’informations sous contrôle et d’en exploiter la richesse.

Aujourd’hui, les entreprises axent en priorité leurs stratégies data autour des données dites « structurées » que contiennent leurs bases et leurs applications métiers. À juste titre puisque ces données constituent un gisement majeur de connaissances que les nouveaux outils d’analyse avancée permettent d’exploiter. Cependant, les données structurées ne constituent qu’une partie émergée de l’iceberg informationnel des organisations : selon une étude du cabinet IDC1, plus de 90% des données se trouvent en effet sous des formes non structurées (documents, vidéos, images, …), et négliger cette masse considérable constitue à la fois un risque et une perte d’opportunités pour l’entreprise.

Des données hétérogènes, une gestion fragmentée

Outre son volume, la principale caractéristique de cet ensemble, qui traverse tous les métiers et tous les systèmes d’information, est son extrême hétérogénéité. Production, formats, usages, valeur, durée de vie, système mis en œuvre… les données non structurées ont peu de choses en commun. C’est d’ailleurs ce qui explique largement que ce patrimoine informationnel soit si souvent laissé en jachère, ou bien géré et exploité localement, de façon très silotée. Chaque acteur se charge, sans coordination ni partage, des données qu’il produit et qu’il utilise, s’appuyant pour cela sur des outils disparates, peu intégrés au reste du SI, et parfois obsolètes.

Le revers de cette approche fragmentée est qu’elle rend plus difficile une réponse adéquate aux enjeux qui concernent tout autant les données non structurées que structurées : sécurité, conformité, qualité, exploitabilité, maîtrise des coûts et des volumes… Or avec la dématérialisation qui va de pair avec l’essor des modes de travail et de collaboration actuels, ces enjeux se posent avec de plus en plus d’acuité.

La mise en conformité par rapport aux exigences en matière de protection des données personnelles en constitue un très bon exemple. Dans une masse informationnelle hétérogène et silotée, une non-conformité peut en effet résulter de l’incapacité d’identification des informations se rapportant aux personnes physiques. Grâce à l’extraction automatisée d’informations, il est toutefois possible d’adresser cette difficulté tout en permettant la valorisation de contenus a priori « monolithiques ».

Pour une gouvernance globale

Pour tenir compte de l’ensemble des contraintes qui pèsent sur les données non structurées, il s’agit donc de mettre en place une approche permettant d’aborder de façon systématique les questions de sécurité, de conformité (RGPD, fiscale, métier…), de qualité, de traçabilité et de conservation.

Au cœur d’un tel dispositif, les organisations ont tout à gagner en mettant en place une instance de gouvernance pour définir les règles, les rôles et l’outillage qui permettront de garantir qu’à chaque étape du cycle de vie des données seront prises les mesures et les précautions adéquates, et cela en dépit de la diversité des situations et des formats.

Outre qu’une telle politique permet de limiter les angles morts, et donc de maximiser la maîtrise des risques, c’est aussi un levier de réduction des coûts car cela permet de prendre en compte aisément et avec plus d’agilité les nouveaux de contenus numériques qui ne cessent d’émerger, et de gagner en productivité sur des traitements nécessaires pendant longtemps réalisés de façon artisanale.

L’EIM, une approche unifiée créatrice de valeur

Par la gouvernance et les cas d’usage, cette gestion globale des contenus non structurés (Enterprise Content Management, ECM) se rapproche dans les faits de celle des données structurées (Data Management, DM). À terme, il apparaît pertinent de favoriser la rencontre de ces deux mondes autour de la gouvernance informationnelle. Il s’agit de bâtir une architecture de l’information unifiée autour de la notion de connaissance, indépendante des formats sous-jacents.

Reposant sur un cycle de vie commun – capture/production, gestion, valorisation –, une telle approche permet de mutualiser les capacités (gouvernance, outillage…), d’harmoniser les règles, et de démultiplier les possibilités de croisement et d’analyse pour faire émerger la connaissance de l’ensemble des sources disponibles. Et de créer ainsi davantage de valeur à partir des données… quelles qu’elles soient.

« Une gouvernance incluant les données non structurées permet non seulement de maximiser la maîtrise des risques, mais devient aussi un levier de réduction des coûts dans la prise en compte avec plus d’agilité des nouveaux contenus numériques, et de gagner en productivité sur des traitements réalisés pendant longtemps de façon non-industrielle. »

À retenir

  1. Bien que majoritaires dans les systèmes, les données non structurées restent sous-exploitées en raison d’une gestion et d’un outillage cloisonnés.
  2. Mettre en place une gouvernance globale permet de réduire les coûts et les risques associés à ce patrimoine, et de pouvoir en exploiter toute la richesse.
  3. À terme, l’EIM a vocation à rapprocher données structurées et non structurées dans une même approche pour en démultiplier la valeur.

Auteur

Lucien Guillermin

EIM Offering Leader
    Pour aller plus loin

      Livre blanc : démocratiser la donnée pour créer de la valeur

      Les clés de la révolution data-centric

      Data et intelligence artificielle

      Maîtrisez vos données et transformez votre organisation.