GlusterFS è un file system di­stri­bui­to e li­be­ra­men­te scalabile, che aggrega elementi di ar­chi­via­zio­ne da più server in un unico file system. I file system operano dietro le quinte. Ge­ne­ral­men­te dopo l’in­stal­la­zio­ne non vengono più presi in con­si­de­ra­zio­ne, a meno che i dati non vengano persi o il file system non arrivi al limite, a causa, ad esempio, della di­men­sio­ne massima di una par­ti­zio­ne o dei limiti di pro­fon­di­tà del percorso di memoria.

Cosa significa e cos’è GlusterFS?

Il nome “Gluster” deriva da “GNU” (GNU’s not Unix) e “Cluster”. Il sistema è stato pub­bli­ca­to sotto la GNU General Public License (GNU-GPLS) e può quindi essere uti­liz­za­to gra­tui­ta­men­te. Il termine “cluster” (tra­du­zio­ne letterale: “grappolo”) descrive, nel contesto dei supporti di dati, il rag­grup­pa­men­to logico di unità fisiche di memoria. Nell’ambito dei computer si riferisce a una com­bi­na­zio­ne in rete di più sistemi. GlusterFS unisce questi approcci rag­grup­pan­do lo spazio di ar­chi­via­zio­ne dei computer collegati in rete e uti­liz­zan­do­lo come unità logica.

Il progetto è stato pub­bli­ca­to nel 2005 da Gluster Inc. Nel 2011, il di­stri­bu­to­re Linux RedHat ha rilevato l’azienda e da allora ha con­ti­nua­to a svi­lup­pa­re il file system. La versione 7 di GlusterFS è stata ri­la­scia­ta nel gennaio 2020; essa è di­spo­ni­bi­le pre­com­pi­la­ta per le seguenti di­stri­bu­zio­ni Linux:

  • CentOS
  • Debian
  • Fedora
  • RedHat/RHEL
  • SUSE
  • Ubuntu

La re­stri­zio­ne ai sistemi basati su Unix è dovuta all’in­te­gra­zio­ne della memoria tramite il modulo FUSE, che non è ancora in grado di garantire una suf­fi­cien­te stabilità in Windows.

N.B.

FUSE è l’ab­bre­via­zio­ne di File System in Userspace. I sistemi operativi sono so­li­ta­men­te divisi in spazio utente e kernel. Quest’ultimo è par­ti­co­lar­men­te protetto e ac­ces­si­bi­le solo con diritti di am­mi­ni­stra­to­re. Pertanto, il montaggio (“mounten”) e la gestione delle unità sono ge­ne­ral­men­te possibili solo con diritti di am­mi­ni­stra­to­re. Tuttavia, FUSE consente di gestire i file system anche agli utenti.

I computer possono fungere da server e da client. L’accesso al file system è possibile anche da altri sistemi. Sono sup­por­ta­ti NFS (Network File System) e SMB/CIFS (Server Message Block/Common Internet File System).

Fun­zio­na­men­to di GlusterFS

Un file system di­stri­bui­to ha senso solo se più computer sono collegati tra loro. Nella do­cu­men­ta­zio­ne di GlusterFS vengono richiesti almeno tre server. Il termine “server”, tuttavia, non va preso alla lettera, in quanto può com­pren­de­re pra­ti­ca­men­te ogni forma di hardware fisico o emulato. Oltre a qualsiasi computer, è fattibile anche l’uso di macchine virtuali, con vantaggi so­prat­tut­to in termini di fles­si­bi­li­tà.

I server integrati fungono da Nodes (punti nodali), che si collegano tramite la rete TCP/IP. I di­spo­si­ti­vi integrati formano un co­sid­det­to Trusted Pool, ovvero un’in­ter­con­nes­sio­ne di server af­fi­da­bi­li. Questi mettono a di­spo­si­zio­ne la loro memoria sotto forma di Bricks (mattoni), sui quali vengono formati i Volumes (unità). Questi ultimi possono essere montati e uti­liz­za­ti come normali supporti dati. I computer che accedono vengono definiti client. Un PC può essere sia server, sia client.

Una ca­rat­te­ri­sti­ca par­ti­co­la­re è la grande sca­la­bi­li­tà: infatti è possibile ag­giun­ge­re in un secondo momento un numero qualsiasi di Nodes e Bricks. Ciò consente di adattare con­ti­nua­men­te le di­men­sio­ni dello spazio di memoria in base alle esigenze. La di­men­sio­ne massima della memoria da gestire è di diversi petabyte.

Inoltre, GlusterFS ga­ran­ti­sce la sicurezza at­tra­ver­so la ri­don­dan­za. Il rischio di guasto è ini­zial­men­te di­stri­bui­to su più sistemi, che possono anche essere separati fi­si­ca­men­te. Inoltre, è possibile impostare gruppi RAID, dove, invece del Volume Di­stri­bui­to standard, deve essere creato un Volume Replicato. Questo volume memorizza ogni file due volte e cor­ri­spon­de ad un Mirror-RAID.

Fatto

Il Redundant Array of In­de­pen­dent Disks (RAID) è un’in­ter­con­nes­sio­ne di dischi rigidi, fi­si­ca­men­te in­di­pen­den­ti, sui quali viene costruita un’unità coerente. A seconda dell’obiettivo, si può dare più im­por­tan­za alla velocità o alla sicurezza dei dati. Di con­se­guen­za, lo spazio di ar­chi­via­zio­ne viene poi ridotto tramite un’ar­chi­via­zio­ne multipla dei dati o tramite la me­mo­riz­za­zio­ne di in­for­ma­zio­ni ag­giun­ti­ve per il recupero di un file.

GlusterFS offre dieci Trans­la­tor pre­de­fi­ni­ti per le ope­ra­zio­ni sullo spazio di memoria, che traducono i comandi per l’ese­cu­zio­ne sulla memoria, impartiti con i diritti dell’utente. Ne sono un esempio il trans­la­tor “Storage”, che memorizza i dati sul file system locale e ne controlla l’accesso, o il trans­la­tor “En­cryp­tion”, re­spon­sa­bi­le della crit­to­gra­fia.

Una nuova fun­zio­na­li­tà è la replica geo­gra­fi­ca, che permette la di­stri­bu­zio­ne asincrona di dati su server con ubi­ca­zio­ni diverse. Ciò offre una pro­te­zio­ne ag­giun­ti­va da impatto fisico sui server, ad esempio at­tra­ver­so eventi dannosi come incendi o furti. Un computer funge da Master e un altro da Slave e la tra­smis­sio­ne dei dati è protetta da SSH (Secure Shell).

Vantaggi e svantaggi di GlusterFS

Abbiamo riassunto per voi alcuni vantaggi e svantaggi di un file system di­stri­bui­to rispetto a un sistema di ar­chi­via­zio­ne di rete con­ven­zio­na­le:

Vantaggi di Gluster Svantaggi di Gluster
Buon utilizzo delle capacità esistenti Creazione di una struttura di rete più complessa
Maggior sicurezza Maggior impegno am­mi­ni­stra­ti­vo durante l’in­stal­la­zio­ne
Di­stri­bu­zio­ne del carico di rete Necessità di un’in­fra­strut­tu­ra di rete veloce
Ottima sca­la­bi­li­tà Sforzo sup­ple­men­ta­re per la sicurezza tecnica

Casi d’uso di GlusterFS

In linea di principio, GlusterFS riflette esem­plar­men­te un cloud. Lo spazio di memoria che si trova in un cluster è reso ac­ces­si­bi­le ai client collegati. Ciò è par­ti­co­lar­men­te adatto per le reti di grandi di­men­sio­ni in cui sono di­spo­ni­bi­li risorse suf­fi­cien­ti per creare un’in­ter­con­nes­sio­ne.

Poiché i di­spo­si­ti­vi sono collegati tramite il pro­to­col­lo Internet, il file system di­stri­bui­to è adatto so­prat­tut­to alle strutture aziendali con più filiali. Tuttavia, anche nelle strutture più cir­co­scrit­te, si può ri­spar­mia­re in tal modo memoria di rete, senza dover ri­nun­cia­re alla ri­don­dan­za.

Al­ter­na­ti­ve a GlusterFS

Un’al­ter­na­ti­va a GlusterFS è Ceph, che è di­spo­ni­bi­le gra­tui­ta­men­te e offre molti dei vantaggi dei file system di­stri­bui­ti che vi abbiamo elencato sopra. Ceph e Gluster hanno ri­spet­ti­va­men­te diversi vantaggi e svantaggi.

BeeGFS (ex FhGFS) è stato svi­lup­pa­to dal Frau­n­ho­fer Institut so­prat­tut­to per sistemi in­for­ma­ti­ci ad alte pre­sta­zio­ni. Inoltre è gratuito e si distingue per una fun­zio­na­li­tà semplice.

Nel settore com­mer­cia­le esistono anche sistemi Microsoft come Storage Spaces Direct (S2D), anche se il loro utilizzo è limitato ai server Windows con licenza a pagamento.

Vai al menu prin­ci­pa­le