In particolar modo nelle aziende di medie dimensioni si sottovalutano le conseguenze sul proprio business dei problemi legati all’IT. Un motivo è l’alta affidabilità dei componenti standard utilizzati oggigiorno dalle aziende operanti nell’IT. Solitamente viene garantita una disponibilità del 99,9 percento. Un valore che sembra alto, ma che prevede un massimo di 9 ore di downtime in un anno. Dovesse poi capitare nelle ore di punta, anche un’irraggiungibilità del server di breve durata potrebbe essere molto costosa per l’azienda.
I sistemi IT con una disponibilità del 99,9 percento sono ormai diventati degli standard per consentire l’apertura di dati e il funzionamento di programmi critici. Per questi viene garantito un downtime non superiore ai 52 minuti all’anno. Alcuni esperti IT parlano addirittura di una disponibilità del 99,999 percento e così questi sistemi permetterebbero di non superare i 5 minuti all’anno di downtime.
Il problema con tali indicazioni è che queste fanno riferimento solamente alla sicurezza da guasti dell’hardware del server. La definizione dell’IEEE (Institute of Electrical and Elcetronics Engineers) perciò considera un sistema come altamente disponibile, se questo, nonostante il guasto di componenti di sistema, è in grado di mettere in sicurezza la disponibilità delle sue risorse IT:
“High Availability (HA for short) refers to the availability of resources in a computer system, in the wake of component failures in the system.”
Questa disponibilità viene raggiunta ad esempio attraverso server ridondanti. Tutte le parti fondamentali sono doppie, ed in particolare lo sono i processori, i chip di archiviazione e le unità I/O. In questo modo si evita che un difetto di un componente paralizzi il server, ma l’alta disponibilità non difende chiaramente da un incendio nel centro di elaborazione dati, da attacchi mirati tramite malware e attacchi DDoS, da un sabotaggio o dal controllo del server da parte di hacker. In realtà però gli imprenditori devono tenere conto di tempi di inattività ben più lunghi ed attuare quindi misure adeguate di prevenzione e di limitazione dei danni.
Ulteriori strategie per compensare un malfunzionamento del server, consistono in sistemi di standby e cluster ad alta disponibilità. Entrambi i sistemi si basano sulla connessione di due o più server, che assieme mettono a disposizione più risorse hardware di quelle necessarie per il normale funzionamento.
Un sistema di standby è un secondo server che serve per la messa in sicurezza del sistema principale e che assume le sue funzioni, appena questo smetta di funzionare a causa di un problema hardware o software. Lo spostamento del controllo dei servizi ad un altro server viene chiamato failover e viene attuato attraverso un software cluster manager (ovvero un software dedicato alla gestione di computer cluster), senza che sia necessario l’intervento dell’amministratore. Una struttura simile composta da un nodo attivo e da uno passivo può essere considerata come un cluster asimmetrico ad alta disponibilità. Se invece tutti i nodi del cluster consentono il normale funzionamento dei servizi, si parlerà di una struttura simmetrica.
Poiché durante la migrazione di un servizio da un sistema ad un altro avviene comunque un ritardo, i sistemi standby e i cluster ad alta disponibilità presentano comunque la possibilità di una breve interruzione.