Technologie de l'information
Le plan de reprise après sinistre
De nombreux imprévus ont le potentiel de dévaster les systèmes informatiques. Établissez un plan de reprise après sinistre afin de minimiser les temps d'arrêt.
TIRÉ DU NUMÉRO : NOV.-DÉC. 2004 | PAR JOHN W. YU
La plupart des sociétés deviennent paralysées lorsque leur système informatique ne fonctionne plus. C'est pourquoi le plan de reprise après sinistre constitue un aspect essentiel de la planification de la continuité des activités pour les services informatiques. Pourtant, bon nombre de sociétés négligent de se préparer à une telle éventualité. Pour plusieurs, la préparation se limite à la sauvegarde de copies de secours entreposées à un autre emplacement.
Sans stratégie précise, la procédure de reprise à partir de bandes de sauvegarde peut être très hasardeuse. L'aspect le plus important du plan de reprise est d'évaluer les risques que courrait la société si le système informatique n'était pas fonctionnel pour une période prolongée. Pour les services des TI, la première étape consiste à déterminer ce qui constitue un délai d'interruption acceptable. Pour certaines sociétés, le délai maximal peut être de 48 heures, tandis que pour d'autres il peut être de plusieurs journées, voire des semaines.
Généralement, le plan de reprise porte sur une période déterminée et permet la continuité des activités pendant le rétablissement du centre de traitement des données. Lorsqu'un sinistre important frappe, les sociétés doivent être en mesure de mettre en place leur système informatique à un autre endroit et d'y installer les logiciels essentiels avant de pouvoir récupérer les données à partir des bandes de sauvegarde.
Le plan doit tenir compte du fait que l'on ne peut se procurer un serveur auprès de n'importe quel détaillant de matériel informatique, contrairement aux ordinateurs de bureau. Étant donné qu'il peut être impossible de rétablir toutes les applications informatiques dans un bref délai, le plan devrait indiquer l'ordre de priorité pour le rétablissement des applications. Puisque la plupart des organisations ne peuvent fonctionner sans système de courriel, le rétablissement de celui-ci est généralement prioritaire. Bon nombre d'organisations fournissent plusieurs services, à l'interne comme à l'externe, à partir de leur site Web. Le rétablissement d'une connexion Internet adéquate ferait donc partie des premières étapes du plan.
Une approche par étapes
IBM recommande les mesures suivantes pour la planification de reprise après sinistre :
Première étape : Analyse critique
- Déterminer les groupes et les processus essentiels à la continuité des activités et à la prestation des produits et services.
- Déterminer les exigences nécessaires pour assurer la prise en charge de ces processus au cours d'une panne prolongée.
- Déterminer les sinistres en fonction desquels le plan est établi.
- Déterminer le but du plan de reprise.
- Déterminer les applications dont le rétablissement est prioritaire.
- Classer les services et les fonctions selon leur délai de rétablissement acceptable et établir l'ordre de priorité du rétablissement des applications informatiques.
Deuxième étape : Élaboration du plan de reprise
- Déterminer les tâches à exécuter, notamment la mise en place des serveurs, du système électrique et des connexions Internet, l'installation des logiciels et le rétablissement des données à partir des bandes de sauvegarde, et les classer par ordre de priorité.
- Déterminer les rôles et les responsabilités de chacun, consigner par écrit les tâches attribuées à chacun, la façon de les exécuter et le moment pour le faire.
- Déterminer les ressources nécessaires, par exemple, l'espace requis, l'alimentation électrique, les serveurs et les ressources humaines.
- Consigner par écrit toutes les procédures de reprise après sinistre.
Troisième étape : Test
La dernière étape consiste à tester le plan pour s'assurer qu'il est approprié et applicable. La procédure se limite parfois à un essai de reprise à partir des bandes de sauvegarde. Mais il peut être nécessaire de demander à des employés de se rendre aux batteries de serveurs pour y installer des logiciels, rétablir les données à partir des copies de sauvegarde, puis procéder à une panoplie de tests. Dans le cas de systèmes complexes, le processus peut comprendre plusieurs itérations, au fur et à mesure que l'on découvre, puis corrige, des erreurs et omissions dans les procédures de reprise. Il est recommandé de tester les procédures au moins une fois par année.
Stratégies de reprise
Une société doit être en mesure de rétablir rapidement certaines applications essentielles afin de garantir le bon déroulement de ses nombreux processus opérationnels. Plus le délai de reprise est court, plus les coûts de la stratégie de reprise sont élevés. Par exemple, dans le cas d'une institution financière dont les clients exécutent couramment des opérations en ligne, le délai de reprise acceptable doit être limité à quelques heures. Tout délai supplémentaire risque d'entraîner la non-exécution de nombreuses opérations et d'avoir des effets directs sur les résultats. À l'opposé, certains cabinets comptables peuvent poursuivre leurs activités manuellement pendant la remise en œuvre des systèmes informatiques, ce qui permet de prévoir un délai de reprise de quelques jours, voire quelques semaines. La stratégie de reprise varie selon les besoins de chaque société. On utilise en général l'une des quatre stratégies suivantes :
1. Double des systèmes
La stratégie de reprise la plus rapide consiste à mettre en place un double du matériel informatique, des données, du matériel de communications, des systèmes électriques, ainsi qu'une connexion Internet, prêts à fonctionner à un autre emplacement.
Si la société ne peut se permettre de délai d'interruption, elle peut utiliser un site miroir, c'est-à-dire un système de relève établi à un autre emplacement et qui fonctionne parallèlement au système opérationnel. Toutes les opérations sont enregistrées automatiquement dans le système opérationnel et dans le système de relève.
Si le système opérationnel est frappé par un sinistre, le système de relève entre en fonction et assure la continuité des activités. La mise en place d'un système de relève constitue la solution la plus coûteuse, mais assure la meilleure protection. Bien peu de sociétés peuvent se permettre une telle stratégie, ou en ont besoin.
2. Site de secours
Un abonnement à un site de secours est une entente avec un fournisseur de services de relève donnant accès à un emplacement physique doté de tout le matériel nécessaire. Cette stratégie comporte des coûts d'exploitation relativement élevés. Plus le délai de reprise garanti est court, plus les coûts de l'abonnement seront élevés. En général, un tel service procure un délai de reprise de quelques heures ou quelques jours. Le fournisseur de services assure le traitement des données de l'organisation pendant la mise en place d'un nouveau centre de traitement des données, ce qui peut exiger plusieurs semaines. Il s'agit d'un service conçu pour une période restreinte.
3. Service de livraison rapide
L'abonnement à un service de livraison garantie de serveurs et d'autres éléments de matériel essentiels, appelé « livraisonrapide », constitue une autre stratégie de reprise. Il s'agit d'une entente conclue avec un fournisseur pour la livraison de matériel informatique à l'emplacement du système de relève du client. Cette stratégie est généralement moins coûteuse que les deux précédentes.
4. Acquisition
La stratégie la moins rapide consiste à acheter le matériel informatique, les données et le matériel de communications lorsque survient le sinistre. Elle comporte les coûts les moins élevés. En fait, aucune dépense n'est engagée jusqu'à ce qu'un sinistre ne survienne. Les coûts d'acquisition du matériel au moment du sinistre sont potentiellement plus élevés, puisqu'il faudra peut-être payer plus cher pour profiter d'un délai de livraison réduit. Les délais de reprise pour cette stratégie se mesurent généralement en semaines.
Finalisation du plan
Pour bon nombre d'organisations, la solution la plus pratique consiste à amalgamer les stratégies décrites plus haut. Dans le cas des applications les plus critiques exigeant un délai de reprise très court, il est préférable de mettre en place un double du système, prêt à fonctionner. Pour les applications les moins critiques, la société peut prévoir l'achat du matériel nécessaire, selon ses besoins.
Rappelons que la planification de reprise après sinistre ne concerne pas seulement les services des TI; la société doit veiller à ce que tous ses services disposent d'un plan de continuité des activités. À défaut de le faire, elle risque d'être en mesure de rétablir rapidement ses systèmes informatiques les plus critiques, mais de ne pas pouvoir les utiliser puisque les divisions n'auront peut-être pas déterminé leurs principaux besoins.
Restez à jour
Bien des sociétés consacrent d'énormes ressources à l'élaboration d'un plan de reprise après sinistre assorti d'une vaste documentation détaillée, mais négligent d'actualiser leur plan. Pour être efficace, un plan doit être constamment mis à jour. En outre, il est recommandé aux sociétés d'effectuer un test complet au moins une fois l'an pour s'assurer que leur plan est approprié et applicable.
|
Ressources pour la planification de reprise après sinistre
L'élaboration d'un plan de reprise après sinistre peut constituer un exercice coûteux. Dans le cas d'activités complexes, on peut avoir recours à des consultants externes spécialisés en la matière afin de simplifier le processus de préparation d'un plan. On trouve également de nombreuses ressources en ligne (en anglais seulement), notamment
- Le site « Disaster Recovery Guide » traite de tous les éléments possibles d'un plan de reprise et fournit de nombreux détails. www.disaster-recovery-guide.com
- Le site des services d'informatique et de réseaux de l'Université de Toronto est une excellente ressource. www.utoronto.ca/security/index.htm
- Le site « Disaster Recovery Planning » est une source d'information gratuite indépendante des fournisseurs, offerte par Toigo Partners International. www.drplanning.org
- Le site « Disaster Recovery Zone » contient des conseils éclairs pour vous aider à bien comprendre le rôle et les responsabilités d'un directeur de projet de reprise après sinistre.
www.disaster-recovery-zone.com |
[ Haut de la page ]
John W. Yu, M.Sc., CDP, FCGA, travaille dans le secteur des TI depuis 1970 où il a occupé divers postes à titre de gestionnaire et de conseiller. Monsieur Yu est vice-président du Service des TI à CGA-Canada et assure la coordination de la chronique « Double clic ».