MefIMS

La soluzione Multiple Events and Failures Integrated Monitoring System ha come obiettivo il full monitoring  di complesse architetture di rete.
 Mission attuata grazie alla messa in esercizio di una serie di strumenti di monitoraggio e controllo. L’architettura del MefIMS è basata sull’utilizzo del protocollo Simple Network Management Protocol (SNMP).

MefIMS è stato strutturato grazie alla personalizzazione della soluzione Open Source Nagios per l'analisi, la gestione dello stato e delle funzionalità dei vari sistemi di rete, all'utilizzo del modulo Open Source Centreon per un'interfaccia grafica personalizzabile e completa e la possibilità di integrazioni con funzionalità di report, mappe (NagVis) e business intelligence ed all'utilizzo del modulo di visualizzazione NagVis che, opportunamente configurato, permette il monitoraggio dell’intero sistema su mappe personalizzate multi-livello. NagVis integra il modulo personalizzato “Communication Server Screening”, appositamente sviluppato per ottenere il controllo di parametri variabili quali: temperatura, umidità, tensione elettrica, ecc. I parametri verranno rappresentati da indicatori grafici in grado di visualizzare in tempo reale i livelli rilevati dai sensori.

Il monitoraggio dei parametri “mission critical”, presenti in un data center, prevede l’utilizzo di specifici strumenti di campo, soprattutto quando è richiesta la supervisione  di alcune grandezze fisiche. Un sistema di raccolta dati, interfacciato ad una serie di sensori, opererà grazie a comunicazioni basate sulle capacità offerte dal protocollo SNMP.

Il monitoraggio potrà rilevare le seguenti grandezze:
•misura temperatura ed umidità presente all’interno del locale tecnico o armadio rack;
•rilevamento presenza fumo nel locale tecnico o armadio rack ;
•rilevamento presenza allagamento nel locale tecnico;
•rilevamento stato apertura/chiusura porte armadio rack;
•rilevamento presenza della tensione alternata (220VAC);
•rilevamento stato imput digitali;
•misura valore tensione continua (48VDC). 
Il cruscotto MefIMS riporta gli indicatori attivi che, utilizzando un set di icone personalizzato, mostreranno in tempo reale lo stato generale del sistema o la condizione di ogni singola variabile supervisionata. L’hover del puntatore sul singolo indicatore consentirà la comparsa di un menu contestuale che riassumerà lo status ed evidenzierà le eventuali criticità del servizio ad esso associato.

Lo scambio di informazioni tra i vari server ed il MefIMS, consente il monitoraggio di tutti i servizi in run su server fisici e/o vm.
MefIMS consentirà di visualizzare tutte le informazioni e lo storico associati a un servizio/host.  

La piattaforma MefIMS presenta inoltre una procedura automatica di shutdown delle macchine, denominata Safety shutdown, servizio utilizzato  per evitare spegnimenti imprevisti a seguito di perdita di alimentazione elettrica. Il processo di Safety shutdown interagisce con gli UPS e coordina lo spegnimento pianificato delle macchine. Il servizio opera  garantendo il rispetto delle schedulazioni di shutdown, garantendo ad ogni processo, le tempistiche necessarie allo svolgimento delle operazioni di spegnimento in sicurezza. Ove possibile, la procedura potrà riavviare le macchine al ripristino dell’alimentazione elettrica.

MefIMS rende disponibile un’integrazione con Open Service Manager (OSM), soluzione applicativa utilizzata per la gestione di ticket. L’integrazione abiliterà MefIMS alla gestione automatica dei ticket, notificandoli in OSM qualora venisse rilevato un guasto, un valore anomalo o un’interruzione del servizio. OSM procederà quindi al dispaccio automatico del ticket.
La comunicazione tra i due sistemi avverrà attraverso l’invio di notifiche generate da MefIMS  e dirette sistema da OSM. Le suddette notifiche, potranno essere trasformate AUTOMATICAMENTE in ticket da OSM. I ticket, presenteranno tutte le informazioni utili all’individuazione immediata della problematica ed alla localizzazione di quest’ultima. Le notifiche conterranno le informazioni utili alla gestione automatica del processo.
L’integrazione tra i sistemi MefIMS ed OSM consentirà, inoltre, di chiudere i ticket direttamente dalla piattaforma di monitoraggio. MefIMS, infatti, invierà una notifica ad OSM anche nel caso in cui l’Host o il servizio che abbiano in precedenza sollevato un’anomalia dovessero rientrare nei valori della norma.