Ce document résume l’ensemble des tests effectués avec la solution IT Guru d’OPNET Technologies. IT Guru est une suite logicielle modulaire dont le but principal est de faire en sorte que les applications et le réseau fonctionnement bien ensemble. Dans ce cadre, IT Guru propose les fonctionnalités suivantes :

 

Ø      1) Troubleshooting applicatif : modules ACE / AACM

 

Ø      2) Pré déploiement d’applications : IT Guru et modules ACE / AACM

 

Ø      3) Récupération automatique des configurations réseaux sur le réseau réel ainsi qu’interfaçage avec solutions de monitoring telles que MRTG, Infovista, Netflow : Appliance logicielle VNES et module Automation

 

Ø      4) Audit automatique de configurations réseaux : IT Guru et module NetDoctor

 

Ø      5) Validation des changements de configs avant déploiement sur le réseau réel : IT Guru et module OPNET NetDoctor

 

Ø      6) Capacity Planning réseau, étude de la résilience du réseau suite à des cas de pannes d’équipements ou de liens : OPNET IT Guru et module Flow Analysis

 

Ø      7) Publication des rapports sur un serveur Web avec accès sécurisé à distance (Report Server)

 

1) Troubleshooting applicatif

La solution OPNET est livrée avec ces propres agents de capture logiciels ACE (Application Characterization Environment) que l’on commander à distance sur un nombre illimité de postes. De plus, on peut importer dans la solution n’importe quelle trace capturée à partir d’un analyseur de protocole (ex. NG Sniffer, Ethereal,…). Dans le cas de l’étude, nous avons pris une trace Sniffer en entrée et ACE a pu l’importer immédiatement pour analyse.

 

Dans un cadre de troubleshooting applicatif, la fonction principale est de pouvoir décomposer le temps de réponse de la transaction qui pose problème afin de déterminer si le problème est plutôt réseau (bande passante trop faible, congestion ou effets protocolaires) ou plutôt applicatif/système (code applicatif mal écrit, serveurs mettant trop de temps avant de répondre).

 

L’image ci-dessous montre une telle décomposition avec une indication très nette que l’on passe plus de 75% du temps dans le serveur applicatif (en jaune) et certainement pas sur le réseau (les autres couleurs):

 

 

Le module AACM (ACE Advanced Capture Mode) permettant quant à lui de lancer une capture en mode continue afin de pouvoir récupérer des traces lors de problèmes de temps de réponse intermittents (i.e. l’occurrence du problème n’est pas régulière). Dans ce cas, il suffira de configurer un agent ACE en mode continu puis d’extraire du buffer de capture les trames réseaux correspondantes :

 

La solution ACE est capable de générer automatiquement des rapports au format Word et/ou HTML de son analyse et de les envoyer vers Report Server pour archivage et consultation :

 

 

2) Pré déploiement d’applications

Toujours à partir d’une simple trace capturée avec les agents ACE ou via autre solutions, il est possible de prédire quels seront les temps de réponses ainsi que la bande passante additionnelle nécessaire avant déployer celle-ci sur le réseau de production.

 

Plusieurs mécanismes sont disponibles :

 

 

A partir d’une capture prise localement (client et serveurs sur le même LAN), Quick Predict peut très facilement prédire quel sera le temps de réponse WAN en fonction de la localisation finale des clients par rapport aux serveurs :

 

 

 

Toujours dans ACE, le Multi User Quick Predict va permettre de simuler un déploiement d’applications sur un réseau multi sites avec un nombre quelconque d’utilisateurs. A la différence du Quick Predict décrit plus haut, les prédictions tiendront compte du fait que l’on peut avoir plusieurs utilisateurs en simultanée ainsi que plusieurs sites afin d’estimer le temps de réponse mais aussi la bande passante additionnelle nécessaire pour tous les liens WAN :

 

 

 

Finalement, on pourra également si nécessaire, passer dans IT Guru pour des études plus poussées qui vont prendre en compte la vraie topologie du réseau importée depuis les fichiers de configuration, prendre en considération la vraie charge des liens en important ces informations à partir de solutions telles que MRTG, Infovista, …, faire un « tuning » fin des protocoles (TCP, mise en place de QoS,…) :

 

3) Récupération topologie et trafic pour analyse réseau

 

La solution OPNET est capable d’analyser et d’optimiser la topologie du réseau (i.e. analyse des configurations routeurs, switches, firewalls) ainsi que de faire du capacity planning à partir de matrices de flux capturées sur le réseau réel.

 

Pour ce faire, OPNET s’appuie sur VNES (Virtual Network Environnement Server) qui est l’interface entre le réseau réel et le côté analyse et simulation d’IT Guru.

 

VNES utilise différents adaptateurs pour aller récupérer les configurations des équipements réseaux, soit par connexion directe sur l’équipement ou via des solutions de management comme CiscoWorks par exemple. De même, pour le trafic, VNES possède en standard des adaptateurs pouvant être utilisés afin de récupérer et d’injecter dans IT Guru du trafic (charge des liens en provenance de MRTG, INFOVISTA, … mais aussi matrices de flux collectées via un collecteur Netflow ou autre solutions :

Comme le montre l’image ci-dessus, VNES est une appliance dont le but est de toujours avoir une vue « up to date » de la topologie et du trafic passant sur le réseau. Le « client » IT Guru pouvant alors importer en une seule étape toute la topologie ainsi que le trafic depuis VNES dans un environnement virtuel pour des fins d’analyse expliquées plus avant.

 

Concernant l’évaluation, nous avons utilisé des configurations variées (Cisco Multilayer Switches en Native IOS et Hybrid IOS, IBM blade Cisco switches) situés sur les sites de Lognes, Saint-Cloud et Paris.

 

4) Audit automatique des configurations réseaux

IT Guru peut lancer un audit des configurations réseaux à partir d’un moteur de règles comportant plus de 450 règles, touchant à des aspects protocolaires (protocoles de routages IP, configuration QoS, VLAN, VPNs, Spanning Tree, …) et sécurité (configuration ACLs, TACACS+, AAA, …).

 

Le code source de chaque règle est disponible (language python) et l’on peut facilement modifier ou ajouter des règles propres au fonctionnement spécifique du réseau HSBC si nécessaire. Le moeteur de règles s’appuie sur le module NetDoctor et en sortie, il va produire des rapports HTML listant les erreurs de configurations détectés :

 

 

Dans sa version automatisée (i.e. avec la module Automation), on pourra configurer la solution pour faire des imports de configurations à intervalle régulier (jour, semaine, mois) et générer également des rapports de différences afin de lister les changements de configurations et les nouvelles erreurs pouvant avoir été détectées :

 

 

Toujours dans la même optique, il sera également possible de générer des rapports de tendances (i.e. vérifier si au cours du temps, le nombre d’erreurs et de warnings va en diminuant :

 

 

Le module NetDoctor peut être configuré pour envoyer des alarmes par email, SNMP, message syslog, voire également des solutions de ticketing comme Remedy.

5) Validation des changements de configurations

A l’instar d’un simulateur d’avions, IT Guru pourra être également utilisé afin de tester et valider les changements de configurations dans un environnement virtuel, sans aucun impact sur le réseau réel (i.e. on ne prendra plus le risque de faire « tomber » une partie du réseau suite à une opération manuelle non validée au préalable par NetDoctor).

 

Dans IT Guru, on pourra « faire semblant » de se connecter sur un équipement réseau et utiliser des vraies commandes (Cisco uniquement) afin de vérifier si les changements envisagés ne vont pas avoir d’effet de bord indésirable :

 

 

Suite au changement « virtuel », on pourra relancer un NetDoctor pour analyser les nouvelles configurations et vérifier si aucune erreur n’est trouvée.

 

De même, on pourra injecter dans la topologie, une nouvelle config d’un nouvel équipement et vérifier si celui-ci va se connecter correctement avec le reste du réseau.

6) Capacity Planning et Cas de Pannes

En plus de la topologie, on pourra également importer des matrices de flux, injecter du trafic de transactions réelles via le module ACE, créer des demandes de type VoIP afin de vérifier si le réseau est capable de supporter l’ajout de trafic :

 

IT Guru est capable de recréer les tables de routages des équipements via son module Flow Analysis. On pourra donc router les matrices de trafic présentes dans la topologie (en bleue dans l’image ci-dessus) et afficher graphiquement la route entre deux points du réseau (en pointillé jaune ici). Enfin, on va pouvoir colorer les liens en fonction du volume de trafic passant dessus (légende en haut à droite).

 

Finalement, des scénarios de cas de pannes pourront être définis afin de tester la résilience du réseau. En sortie, un rapport HTML sera généré avec la liste des scénarios pour lesquels on risque d’avoir une perte de connectivité ou des demandes de trafic qui vont toutes basculer sur un lien de backup sous dimensionné, ce qui risquerait d’occasionner un engorgement du réseau.

 

7) Publication des rapports

Tous les rapports pouvant être générés au format Word ou HTML pourront être automatiquement envoyés vers Report Server, un serveur web avec accès sécurisé à distance pour consultation :