Passer au contenu

Industrialiser l’IA : comment produire vite et bien des modèles profitables

Guillaume Gérard
16 octobre 2023

Pour amplifier la transformation data des entreprises, les initiatives de valorisation de données doivent aboutir plus rapidement et apporter un retour sur investissement mesurable.

Cette dynamique de changement passe notamment par l’industrialisation de la production des modèles d’IA.

Désormais largement convaincues du potentiel de l’intelligence artificielle (IA), les entreprises investissent sur le sujet avec des ambitions claires et des objectifs précis. Pourtant, certaines constatent des résultats en deçà de leurs attentes. Selon une étude du Capgemini Research Institute[1], seulement 13% des projets IA sont déployés avec succès et appliqués à grande échelle. Bien souvent, la raison principale tient aux difficultés rencontrées, ou sous-estimées, lors du passage à l’échelle des modèles.

Les éléments clés de succès de l’industrialisation

Pour tout projet d’IA, le passage à l’échelle est une étape d’autant plus délicate que la marche est particulièrement haute entre le prototype et la solution opérationnelle. Pour qu’un outil d’IA porte pleinement ses fruits, plusieurs aspects sont à prendre en compte dès le départ :

  • Facteurs opérationnels : au-delà de la pertinence et de la performance théoriques du modèle, il faut s’assurer que le temps de traitement, la fréquence de rafraîchissement ou encore la présentation des résultats seront compatibles avec les usages envisagés. Ces facteurs doivent être définis sous forme d’indicateurs de performance et être suivis tout au long du projet. Il faut aussi veiller à ce que les utilisateurs acceptent et adoptent la solution, si possible en leur donnant les moyens d’en comprendre et d’en expliquer les résultats.
  • Facteurs de rentabilité : Il faut vérifier que le coût de ces infrastructures n’excèdera pas les bénéfices attendus, ce qui n’est pas toujours acquis. L’approche FinOps permet de traiter de ces problématiques en ayant une démarche maîtrisée de suivi des coûts. Dans ce calcul de ROI, on tiendra aussi compte des gains extra-financiers potentiels, par exemple en matière de productivité, de qualité de service, de satisfaction client et employé, ou d’impact environnemental.
  • Facteurs techniques : L’entreprise doit pouvoir mettre en œuvre les moyens IT que suppose la solution, par exemple pour traiter en temps réel de très forts volumes de données ou gérer des bases de données orientées graphe.
  • Facteurs réglementaires : Dans le cas où le RGPD s’applique aux données utilisées, il faut prendre les dispositions adéquates pour les anonymiser, les protéger, et obtenir le consentement des personnes.
  • Facteurs environnementaux : L’empreinte environnementale des infrastructures, des données et des traitements, notamment leur consommation énergétique, ne doit pas être démesurée par rapport aux objectifs visés.
  • Facteurs éthiques : Il est essentiel de s’assurer que le modèle et l’usage qui en sera fait sont bien compatibles avec les valeurs de l’entreprise et qu’ils resteront dans les limites qu’elle se fixe.

Dérive des données et dérive des usages

À ce jeu de contraintes, s’ajoute une particularité propre à l’IA : son besoin fondamental de suivi. Du jour où elle est lancée, une IA peut en effet voir ses performances se dégrader peu à peu jusqu’à passer audessous d’un seuil minimum d’acceptabilité. Un modèle étant conçu pour répondre à une question précise à partir d’un ensemble de données, sa réponse perdra en pertinence sitôt que les données ou la question évolueront.

Le premier cas, la dérive des données, est très courant car, on choisit généralement pour le POC un jeu de données stable, restreint et de bonne qualité, ce qui ne reflète pas toujours les conditions réelles. Pour maintenir la qualité des résultats, il faudra donc être capable de réentraîner le modèle sur des données plus à jour et plus représentatives.

Plus insidieux, le second cas, la dérive des usages, tient à l’évolution des attentes des utilisateurs. Alors qu’elle correspondait parfaitement à leur besoin à l’origine, l’IA peut, par exemple, ne plus leur suffire, le contexte ayant changé, ou bien continuer à attirer leur attention sur des problèmes désormais réglés. L’application ne leur étant plus utile, ils s’en détournent progressivement.

Ces phénomènes de dérive, communément appelés “drift”, sont tout à fait naturels et souvent inévitables. Ils doivent par conséquent être anticipés, détectés et réglés au fil de l’eau. C’est pourquoi l’IA doit être considérée et gérée comme un produit, en constante évolution. Contrairement à la plupart des solutions IT, le jour de la mise en production ne marque donc pas la fin du projet, mais seulement celle du premier cycle d’un processus d’apprentissage continu.

Une approche industrialisée du cycle de vie

  1. La définition du problème : dans un premier temps, il est nécessaire que métiers et équipes data aient une même compréhension des résultats attendus. Pour cela, le métier doit exposer la problématique à traiter aux data scientists, lesquels émettent alors un premier diagnostic de faisabilité. Cette première étape est également l’occasion de définir les différents KPIs à suivre tout au long du projet.
  2. La construction du modèle : lors de cette étape, essentiellement confiée aux data scientists, on ne se limite à la précision mathématique du modèle, mais on intègre d’emblée des indicateurs mesurant ses bénéfices pour le métier ainsi qu’un questionnement « by design » sur les aspects opérationnels, éthiques, réglementaires, etc.
  3. L’industrialisation du modèle : on déploie le modèle après s’être assuré qu’il sera exploitable en environnement de production. Cela nécessite de traiter plusieurs problématiques concernant les performances et les délais de traitement, de la capacité du modèle à bien fonctionner sur les données de production, et enfin le respect des critères environnementaux.
  4. La supervision : une fois la solution en production, on met en place un suivi du modèle, de ses performances, de son utilisation, de la qualité des données, et on positionne des seuils d’alerte afin de détecter au plus tôt les éventuelles dérives.
  5. L’entraînement continu : le modèle est constamment réentraîné sur des données rafraîchies et les nouvelles versions peuvent être automatiquement déployées lorsqu’elles apparaissent supérieures, à la fois sur le plan de la pertinence mathématique et de l’intérêt pratique.

« Contrairement à la plupart des solutions IT, le jour de la mise en production ne marque pas la fin du projet d’intelligence artificielle, mais seulement celle du premier cycle d’un processus d’apprentissage continu. »

L’exemple réussi d’un acteur majeur des télécoms

Un opérateur télécom a eu recours à cette démarche pour mettre en œuvre très rapidement une solution d’IA qui lui a permis de répondre aux injonctions de son autorité de régulation et de renforcer sa qualité de service pour ses clients. Pressée d’améliorer significativement la qualité des déploiements de fibre optique, l’entreprise s’est appuyée sur une information dont elle disposait déjà : les photos que prennent les installateurs avant et après le raccordement. En vérifiant certains points de contrôle sur ces images, une solution basée sur l’IA est capable d’identifier les branchements corrects et ceux qui nécessiteraient l’examen d’un technicien.

La démarche d’industrialisation a notamment permis de mettre en place un réentraînement continu du modèle afin de prévenir les éventuelles dérives de données (la qualité des photos évolue avec les nouvelles générations de smartphones, les conditions de prise de vue dépendent des saisons…) et d’usage (par exemple, s’il fallait prendre en compte des fils d’une couleur supplémentaire à la suite de l’arrivée d’un nouvel opérateur).

Permettant de sécuriser et d’accélérer les projets d’IA, la démarche d’industrialisation repose classiquement sur la mise en place d’un triptyque Outils/Processus/Organisation. Il faut cependant insister tout particulièrement sur l’importance d’associer étroitement les parties prenantes métier, IT et data. Un déficit de collaboration entre ces acteurs est en effet un fréquent facteur d’échec des projets, où l’on s’acharne parfois en vain sur des problèmes sans solution ou sur des solutions sans problème ! Mettre tout le monde autour de la table dès le départ, et à chacune des étapes, permet d’éviter de telles impasses et d’aborder les projets d’IA dans une perspective résolument tournée vers leur passage à l’échelle et la maximisation de leurs bénéfices.

À retenir

  1. Seule une approche méthodique et structurée permet d’obtenir les bénéfices attendus des projets d’IA, et notamment de leur mise à l’échelle
  2. En plus de la prise en compte de certaines contraintes dès sa conception, un modèle d’IA doit être sans cesse suivi pour qu’il reste pertinent et performant.
  3. Pour créer de la valeur, une approche industrialisée, orientée produit, couvrant l’ensemble cycle de vie des modèles et associant tous les acteurs est indispensable.

[1] : https://www.capgemini.com/fr-fr/perspectives/publications/entreprise-intelligence-artificielle/

Auteur

Guillaume Gérard

Head of AI, Data Science & Analytics France
    Pour aller plus loin

      Livre blanc : démocratiser la donnée pour créer de la valeur

      Les clés de la révolution data-centric

      Data & intelligence artificielle

      Maîtrisez vos données et transformez votre organisation.