File system parallelo generale
| IBM GPFS | ||
|---|---|---|
| sviluppatore | IBM | |
| Nome e cognome | IBM General Parallel File System | |
| Sistemi operativi supportati | AIX , Linux , Windows Server | |
| introduzione | 1998 ( AIX ) | |
| Confini | ||
| Dimensione massima del file | 2 63 -1 byte | |
| Numero massimo di file | 2 31 | |
| Dimensione massima del nome file | 256UTF-8 | |
| Dimensione massima del volume | 2 99 byte (4 PiB testati) | |
| Caratteristica | ||
| attributi | POSIX | |
| Autorizzazioni di accesso ai file | POSIX e ACL (opzionale) | |
| compressione trasparente | No | |
| crittografia trasparente | No | |
General Parallel File System (GPFS) è un file system distribuito ad alte prestazioni sviluppato da IBM . GPFS fornisce accesso simultaneo ad alta velocità alle applicazioni in esecuzione su più nodi in un cluster fornendo una vista di un disco condiviso tra tutti loro. La più grande configurazione esistente era di oltre 2.000 nodi.
Esistono versioni di GPFS per i sistemi operativi AIX (dal 1998 ) e Linux (dal 2001 ). È incluso come parte di IBM System Cluster 1350 .
Sin dal suo inizio, GPFS è stato applicato con successo in una moltitudine di applicazioni aziendali, tra cui: servizi digitali, reti di analisi e servizi di file scalabili. A partire da marzo 2008 , è utilizzato da molti dei supercomputer che compongono il TOP500 , compresi i due più importanti in Spagna : Magerit e Marenostrum .
Storia
L'origine di GPFS è il file system Tiger Shark, un progetto dell'Almaden Research Center di IBM all'inizio del 1993 , sebbene la prima versione commerciale di GPFS sia stata pubblicata nel 1998 per il sistema operativo AIX .
Inizialmente, GPFS è progettato per supportare le elevate velocità di trasferimento richieste dalle applicazioni multimediali. Questo progetto si è rivelato adatto per il calcolo scientifico.
Architettura
Il file system GPFS è costituito da un insieme di computer che formano un cluster GPFS. Alcuni dei membri del cluster forniscono dischi fisici accessibili da tutti i nodi del sistema. L'inclusione e l'esclusione dei membri del cluster può essere effettuata in modo operativo.
Quando un nodo esegue un'operazione sul file system, i dati vengono distribuiti in strip ("striping") e vengono archiviati in diverse macchine che fungono da dischi. In questo modo si ottengono maggiori prestazioni accedendo in parallelo ai diversi blocchi, elevata disponibilità (le informazioni possono essere archiviate su dischi di due o più server), recovery in caso di guasto, sicurezza, DMAPI , gestione dello storage gerarchico HSM e gestione del Ciclo di vita delle informazioni ILM .
L'inclusione di un nuovo disk server presuppone un miglioramento delle prestazioni ridistribuendo le informazioni, consentendo un più alto livello di parallelismo nell'accesso.