Passer au contenu

Transformer son modèle opérationnel pour réussir sa transformation cloud

Marc Herubel
18 mai 2021

La transformation digitale est engagée, avec pour fondation et moteur de la disruption technologique le cloud, qui permet l’agilité et l’innovation à moindre coût.

Avec l’accélérateur Covid-19, les dépenses d’infrastructure en cloud public ont dépassé les dépenses on-premise.

La transformation cloud est en marche

La plupart des entreprises ont engagé leur transformation cloud, pour développer le « cloud native » ou migrer le legacy, mais elles peinent à passer à l’échelle et à en tirer les bénéfices. La cause en est l’absence de transformation du modèle opérationnel, car on ne peut pas tirer les bénéfices d’une infrastructure cloud agile et automatisée avec des processus qui restent complexes et manuels.

Le modèle traditionnel de production atteint ses limites

Des cycles trop longs. Pour un projet informatique, la production intervient à la fin et fait souvent l’objet d’un projet séparé, piloté par un responsable projet production. Son implication tardive et les difficultés d’alignement entraînent bien souvent des délais ou des compromis sur les plans de test et la qualité.

Des compétences en silos techniques. L’expertise technique est organisée en silos (serveur, stockage, réseau…) avec un éparpillement des outils, un manque de transversalité bout-en-bout. Les modèles ITIL ont été souvent dévoyés, les demandes conduisant souvent à une multiplication des tickets et des aller-retours.

Des opérations très manuelles. La pratique est d’effectuer les paramétrages à la main dans les consoles, sources d’erreurs et de délais. La pression constante sur les coûts a parfois amené les activités offshore, ce qui ne suffit plus, les démarches d’automatisation sont trop rares, basées sur des outils “maison” peu scalables et rendus peu efficaces par l’éparpillement.

Une gestion financière qui donne peu de leviers sur les coûts. Une grande part des coûts d’infrastructure sont généralement peu variables – CAPEX, éléments peu granulaires ou capacité inutilisée. Surtout, les infrastructures traditionnelles s’accompagnent d’une forte surcouche de gestion des services, de la capacité et de multiples outillages qui renchérissent fortement les infrastructures (markup de 30% jusqu’à 200% !)

4 axes de transformation du modèle opérationnel, alignés sur les bénéfices du cloud

1) La verticalisation de la production et le mode produit pour l’agilité et l’innovation

Le principal avantage du cloud est l’agilité et l’innovation à moindre coût. Il s’agit d’améliorer la vélocité et le “Time-to-market” des nouvelles fonctionnalités demandées par le métier. Eliminant les lenteurs du “dernier kilomètre” infrastructure, le cloud est ainsi indispensable à l’agilité.

Pour y arriver, il faut d’abord aligner les organisations, dans une logique de verticalisation par domaine métier pour améliorer la prise en compte des besoins et la collaboration.

Avec des produits métier pilotés dans un modèle agile à l’échelle comme SAFe, les Ops doivent se rapprocher des teams agile, soit en participant directement aux teams pour pouvoir traiter les besoins en mode “plateau” (plutôt qu’en mode ticket), soit en participant à une “system team” qui peut être partagée au niveau d’un train (ART), soit les deux dans une logique de mutualisation.

2) Des plateformes d’infrastructure pour la flexibilité

La flexibilité ou scalabilité est aussi un des avantages du cloud attendu par le métier, pour être capable de faire face à des variations d’activité (saisonnière ou liée au cycle économique) ou à des opérations de fusion-acquisition. Le cloud apporte cette capacité flexible mais il favorise également l’adoption de standards techniques qui renforcent la flexibilité.

C’est l’idée des plateformes, inventée par l’industrie automobile. Chaque cloud sera ainsi une plateforme avec ses services standards, gérée comme un produit bout-en-bout à destination des équipes de développement et dans une perspective dynamique, car le catalogue cloud s’enrichit à grande vitesse.

3) Le renforcement de l’automatisation avec le SRE et DevSecOps pour la résilience

De plus en plus d’entreprises (et leurs RSSI) considèrent le cloud comme plus résilient et plus sécurisé que l’infrastructure traditionnelle, du fait de son automatisation (patching notamment).

Pour aller au bout de cet avantage, il faut renforcer la dimension engineering et automatisation des opérations, avec le DevSecOps et le rôle de SRE (site reliability engineer) popularisé par Google, qui porte la dimension opérationnelle des produits auxquels il contribue.

4) Un nouveau modèle FinOps pour l’optimisation des coûts

Il est désormais largement reconnu qu’il faut installer une démarche FinOps pour activer de puissants leviers d’optimisation des coûts : instances réservées, « power off » des environnements hors prod, « rightsizing », etc.

Pour autant, il ne suffit pas de mettre en place un rôle FinOps et un outil, il est indispensable d’embarquer les équipes applicatives qui doivent valider ou réaliser ces changements. Il est donc nécessaire de faire évoluer le modèle opérationnel en adaptant les processus financiers, les responsabilités et la gouvernance – les coûts du cloud étant pour l’essentiel des coûts directs, l’IT métier en devient responsable.

Un modèle multi-vitesse tenant compte de l’existant

Pour répondre au principal enjeu du cloud qui est l’agilité, le modèle opérationnel doit être adapté selon le type d’applications à gérer, tenant compte du legacy.

Il est donc nécessaire de mettre en place un modèle multi-vitesse, adapté à la vélocité des applications et à leur architecture, qui pourra évoluer dans le temps. Il peut se catégoriser comme suit :

ModèleLegacy optimiséCloud readyCloud native
Cycle / vélocitéCycle en V Version trimestrielleCycle en V agilisé MensuelAgile à l’échelle Continu
ArchitectureFortement coupléeCouplage outilléDécouplée
OrganisationAlignement métier (verticalisation)Equipe SRE / system teamSRE intégré aux teams + system team
Outillage de déploiementMise en place CICDCICD avec templates Infrastructure-as-code / tests automatisésDéploiement blue/green ou canary
SLO (service level objective)Bout-en-bout (disponibilité applicative…)Multidimensionnel (latence, taux de succès des requêtes…)Pilotage par le “burn rate”
Processus incidentPostmortem constructifGestion mode plateauTesting / simulation
ObservabilitéHealthmapSystèmes prédictifs / aide à la décisionSystèmes proactifs “self-healing”

C’est l’avenir des équipes Infrastructure et Opérations qui est en jeu

Le cloud est une profonde transformation pour l’I&O. Il faut faire évoluer les compétences et les activités, mettre en place de nouvelles approches pour réaliser ses promesses. Et surtout ne pas laisser les équipes « produit » sans Ops, car le cloud a besoin d’eux pour renforcer la culture du run, de la disponibilité et de la continuité d’activité.

L’I&O doit se réinventer, cette transformation n’est pas facile mais elle est passionnante !