IBM General Parallel File System
General Parallel File System ( GPFS ) è un file system cluster di IBM . È emerso da diversi progetti di ricerca su file system funzionanti in parallelo ed era ed è venduto con diversi nomi commerciali:
- File system parallelo generale IBM
- Archiviazione elastica
- Scala dello spettro
storia
GPFS è emerso dai progetti di ricerca IBM Tiger Shark File System e Vesta File System ed era originariamente indicato come un file system multimediale , che può ancora essere trovato nei nomi interni oggi. È diventato subito evidente che GPFS è particolarmente adatto per computer ad alte prestazioni grazie alla sua architettura parallela. Nel 1998, GPFS è apparso come un prodotto IBM ufficiale e il successore di Vesta / PIOFS come file system conforme a POSIX .
GPFS è stato o è utilizzato nei supercomputer ASCI White e ASC Purple presso il Lawrence Livermore National Laboratory . Successivamente è stato portato su altri sistemi operativi:
Sono stati supportati altri protocolli di rete come CIFS. Originariamente un file system dietro grandi installazioni di storage, è stato successivamente venduto come prodotto software indipendentemente dall'hardware. Funzionalità come i cluster condivisi non sono state aggiunte più di recente. Il 14 luglio 2014, IBM ha annunciato un servizio cloud chiamato Elastic Storage . Il 17 febbraio 2015, IBM ha rinominato GPFS in Spectrum Scale .
GPFS nel supercomputing
GPFS viene utilizzato come file system cluster con elevata larghezza di banda di lettura/scrittura in diverse installazioni dell'elenco dei super computer TOP500 , esempi:
- NCSA http://www.ncsa.illinois.edu/news/story/ncsa_to_deploy_ibms_gpfs_for_all_supercomputing_systems
- Biowulf / NiH https://www.top500.org/news/nih-receives-major-supercomputer-upgrade/
- Cheyenne / NCAR (SGI) https://www.top500.org/news/ncar-launches-five-petaflop-supercomputer/
- Juron, Julia / Jülich: https://www.top500.org/news/juelich-supercomputing-centre-deploys-cray-and-ibm-supercomputers-for-human-brain-project/
- Centro di calcolo Leibniz, SuperMUC / Monaco https://www.lrz.de/services/compute/supermuc/systemdescription/
- ASCI bianco e viola / LLNL https://asc.llnl.gov/computing_resources/purple/ (2002)
- Sistema Argonne Mira https://www.alcf.anl.gov/mira e https://www.alcf.anl.gov/resources-expertise/data-networking
- un record attuale: https://www.heise.de/newsticker/meldung/IBM-Forscher-stellen-Weltrekord-beim-Massenspeicher-Zugriff-auf-1284611.html
Funzioni
I sistemi di storage integrato di IBM costituiti da hardware e software con GPFS sotto il sistema operativo Linux sono:
- V7000 Unified, un'appliance per l'archiviazione di file e blocchi
- Elastic Storage Server (ESS), vari dispositivi basati sull'alimentazione per l'archiviazione di file e oggetti
- SONAS - Scale Out Network Attached Storage https://www.ibm.com/de-en/marketplace/scale-out-file-and-object-storage (ora in scala spettro )
GPFS / Spectrum Scale ha le seguenti proprietà funzionali:
- Diversi computer NAS possono montare un volume cluster contemporaneamente (in parallelo) per la scrittura, quindi il file system è scalabile per un gran numero di client.
- Lo striping e quindi la lettura e la scrittura parallele sono supportate a livello del dispositivo di archiviazione di massa e dei singoli file. Questo parallelismo consente di ottenere velocità di trasmissione molto elevate.
- Gestione blocchi distribuiti : la scrittura parallela su un file system è resa possibile dal fatto che un file può essere scritto solo da un processo alla volta
- I metadati e i dati possono essere distribuiti su diversi dischi per migliorare le prestazioni
- Diversi server GPFS (chiamati anche nodi) funzionano come un cluster a disponibilità elevata, gli errori vengono intercettati
- GPFS può anche essere basata sul principio della versione 4.1 shared-nothing gruppo di lavoro (FPO - File Placement Optimizer) e può quindi come HDFS lavoro
- limiti molto grandi per la dimensione del file (8 EB ), la dimensione della directory , la dimensione del file system (8 YB ), il numero di file per file system (2 ^ 64)
- Supporto per HSM / Gestione archiviazione gerarchica
- i volumi possono essere condivisi contemporaneamente con protocollo CIFS e NFS , dalla versione 4.1 anche come filesystem distribuito Hadoop .
- Il controllo dei diritti di accesso funziona per NFS (per sistemi Unix) con diritti sui file POSIX e per CIFS (sistemi Windows) con ACL . Questi diritti di accesso ai file possono essere controllati indipendentemente l'uno dall'altro
- Il file system funziona secondo il principio copy-on-write . Simile alle "copie shadow" di Windows, è possibile accedere agli snapshot tramite qualsiasi directory esportata, sia tramite NFS che tramite CIFS
- È possibile la replica asincrona tra diversi volumi GPFS (Gestione file attiva)
link internet
- La homepage del prodotto in IBM è https://www.ibm.com/systems/de/storage/spectrum/index.html
- la pagina delle risorse su IBM è https://www.ibm.com/de-en/marketplace/scale-out-file-and-object-storage
- La pagina di ingresso per la documentazione online IBM è https://www.ibm.com/support/knowledgecenter/SSFKCN/gpfs_welcome.html
- Wiki GPFS https://www.ibm.com/developerworks/community/wikis/home?lang=en#!/wiki/General%20Parallel%20File%20System%20(GPFS)
Evidenze individuali
- ^ Conferenza FAST 2002 sulle tecnologie di archiviazione e archiviazione. Estratto il 30 ottobre 2017 .
- ^ ASCI Viola. Estratto il 30 ottobre 2017 .
- ↑ Ottimizzatore del posizionamento dei file. Estratto il 30 ottobre 2017 .
- ↑ Annuncio di archiviazione elastica. Estratto il 27 gennaio 2018 .