Grenoble - Ingénieur Systèmes & Infrastructure – Plan de Reprise Informatique (PRI)
1 day ago
Grenoble
Description de mission Ingénieur Systèmes & Infrastructure – Plan de Reprise Informatique (PRI) 01/04/2026 Contexte client Notre client est un acteur de l’énergie opérant des services critiques et soumis à des exigences élevées de continuité d’activité et de résilience du SI. Dans un contexte de renforcement des obligations réglementaires (notamment NIS2) et de montée en maturité de son dispositif de continuité, l’organisation souhaite industrialiser un Plan de Reprise Informatique (PRI) robuste, testable et maintenable. La mission s’inscrit dans cette trajectoire et vise à renforcer le socle technique de reprise et l’intégration progressive des applications internes au dispositif. Contexte & Objectifs de mission • Le dispositif actuel s’apparente à un PRA « best effort » : présence de capacités d’hébergement de secours, mais insuffisance de processus formalisés, de scénarios de bascule/retour arrière éprouvés, et de tests réguliers démontrant l’atteinte des objectifs de reprise. Par ailleurs, le SI combine des briques on-prem et des services externalisés (ex. solutions SaaS/Cloud) : la mission se concentre sur le périmètre infrastructure et applications hébergées en interne, en interface avec les équipes en charge du pilotage global et des volets contractuels liés aux services externalisés. • Objectifs principaux :, • Concevoir, déployer et fiabiliser le socle technique du PRI (site de secours, réplication, sauvegarde/restauration, prérequis techniques). • Industrialiser les opérations de reprise (standardisation, automatisation, procédures exploitables). • Intégrer progressivement les applications au PRI en maîtrisant les dépendances techniques (identité, DNS/NTP, PKI, stockage, flux, bases de données).• Définir, exécuter et améliorer les tests de bascule et de retour à la normale (failback), en mesurant RTO/RPO et en corrigeant les écarts. • Produire une documentation opérationnelle permettant la transmission aux équipes d’exploitation et l’inscription dans une démarche d’amélioration continue. Périmètre de la mission Cadrage technique et conception du socle PRI • Prendre en compte les exigences de continuité (RTO/RPO cibles lorsqu’elles seront définies) et les contraintes d’architecture (distance, réseau, sécurité, capacités). • Contribuer à la définition/validation de l’architecture de reprise (en lien avec l’architecte et les équipes infra/réseau/sécurité). • Identifier les prérequis « services socle » indispensables aux reprises applicatives (identité/annuaire, DNS, NTP, PKI, outils de documentation, bastion/accès admin, supervision). Mise en œuvre de l’infrastructure de reprise • Déployer et configurer les environnements techniques du PRI : virtualisation, OS Linux/Windows, réseau, segmentation, VPN, règles firewall. • Mettre en place les mécanismes de ré, • plication (VM, stockage, données) et configurer les chaînes de sauvegarde/restauration., • Assurer la cohérence entre production et secours (versions, configurations, durcissement, comptes techniques, certificats). Industrialisation, standardisation et automatisation • Automatiser les déploiements et opérations de reprise via scripting (PowerShell/Bash) et/ou outils d’orchestration selon l’écosystème. • Standardiser les configurations (templates, golden images, conventions) et rendre les procédures reproductibles. • Réduire le risque opérationnel (checklists, contrôles de cohérence, pré-validations avant bascule). Intégration des applications au dispositif PRI • Préparer les environnements nécessaires à la reprise applicative (compute, stockage, réseau, accès, certificats). • Installer/configurer les composants techniques et formaliser les dépendances (ex. NAS, SQL Server, services tiers, flux entrants/sortants).• Contribuer à l’intégration d’applications hétérogènes, incluant des environnements potentiellement legacy (Windows Server anciens, distributions Linux non à jour), en sécurisant la reprise. • Prioriser avec les équipes internes l’onboarding des applications critiques (ex. ERP Finance, SIG) et définir l’ordre de redémarrage. Gestion de la bascule, de la reprise et du retour à la normale (failback) • Mettre en œuvre et fiabiliser les procédures de bascule vers le site de secours (activation, contrôles, validation de service). • Garantir la cohérence des données/systèmes lors de la reprise (gestion des écarts, risques de désynchronisation, conflits). • Définir et formaliser les procédures de retour à la normale : resynchronisation, rebascule des flux, remise en configuration nominale. • Anticiper et sécuriser les scénarios de failback (fenêtres d’intervention, prérequis, plan de retour arrière) Tests, validation et amélioration continue • Préparer et exécuter les tests PRI (bascule et failback), y compris interventions planifiées., • Mesurer et documenter les résultats (RTO/RPO, performances, points de blocage), piloter les actions correctives. • Contribuer à l’amélioration continue du PRI : mise à jour au fil des évolutions du SI, retour d’expérience incidents, renforcement de la robustesse. Documentation et transfert • Documenter l’architecture technique du PRI (schémas, flux, matrices de dépendances)., • Rédiger les procédures d’exploitation : bascule, reprise, retour à la normale, checklists et runbooks. • Assurer la maintenabilité : documentation à jour, exploitable par les équipes internes et intégrable au référentiel existant. Profil recherché Compétences techniques : • Administration systèmes Linux et Windows (diagnostic, durcissement, services, automatisation)• Virtualisation : VMware et/ou Proxmox (déploiement, templates, sauvegarde, restauration, réplication) • Réseaux & sécurité : segmentation, VPN, filtrage, NAT, routage ; firewalls Fortinet et Stormshield • Sauvegarde, réplication et restauration (stratégies, tests de restauration, cohérence applicative) • Scripting et automatisation : PowerShell, Bash (ou équivalent), industrialisation de runbooks, • Capacité à travailler avec des environnements legacy (OS anciens) et à sécuriser leur reprise, • Notions de supervision et d’exploitabilité (journalisation, contrôles, critères d’acceptation techniques) Compétences fonctionnelles : • Connaissance des dispositifs PRA/PRI et des bonnes pratiques de continuité IT (bascule, failover/failback, runbooks, tests réguliers) • Compréhension des indicateurs de reprise (RTO/RPO) et capacité à contribuer à leur atteinte, • Capacité à analyser les dépendances applicatives et à définir un ordre de reprise cohérent, • Travail en environnement multi-équipes (infra, réseau, sécurité, applicatif) et coordination opérationnelle • Sensibilité aux exigences de conformité et de résilience (ex. NIS2) sans se limiter à l’approche documentaire Qualités personnelles : • Rigueur, sens du détail et exigence sur la fiabilité opérationnelle, • Capacité d’analyse et de résolution de problèmes complexes en contexte d’incident/test, • Esprit de synthèse et aptitude à formaliser (procédures, schémas, documentation exploitable) • Autonomie dans l’exécution et proactivité dans l’identification des risques, • Esprit d’équipe et qualité de collaboration avec des interlocuteurs techniques variés Modalités de mission • Date de démarrage : Début mai 2026 (à confirmer) / ASAP selon disponibilité, • Durée: À définir, • Localisation : Grenoble (présence sur site requise) + télétravail partiel (1 jour par semaine), • Télétravail : 1 jour par semaine, • TJM : Selon profil