Generelt parallell filsystem
| IBM GPFS | ||
|---|---|---|
| utvikler | IBM | |
| Fullt navn | IBM General Parallel File System | |
| Støttede operativsystemer | AIX , Linux , Windows Server | |
| Introduksjon | 1998 ( AIX ) | |
| Grenser | ||
| Maksimal fildimensjon | 2 63 -1 byte | |
| Maksimalt antall filer | 2 31 | |
| Maksimal filnavnstørrelse | 256UTF-8 | |
| Maksimal volumstørrelse | 2 99 byte (4 PiB testet) | |
| Karakteristisk | ||
| egenskaper | POSIX | |
| Filtilgangstillatelser | POSIX og ACL (valgfritt) | |
| gjennomsiktig kompresjon | Nei | |
| transparent kryptering | Nei | |
General Parallel File System (GPFS) er et distribuert filsystem med høy ytelse utviklet av IBM . GPFS gir høyhastighets samtidig tilgang til applikasjoner som kjører på flere noder i en klynge ved å gi en visning av en delt disk mellom dem alle. Den største eksisterende konfigurasjonen var over 2000 noder.
Versjoner av GPFS finnes for AIX (siden 1998 ) og Linux (siden 2001 ) operativsystemer. Den er inkludert som en del av IBM System Cluster 1350 .
Siden starten har GPFS blitt brukt med suksess i en rekke forretningsapplikasjoner, inkludert: digitale tjenester, analysenettverk og skalerbare filtjenester. Fra mars 2008 ble den brukt av mange av superdatamaskinene som utgjør TOP500 , inkludert de to viktigste i Spania : Magerit og Marenostrum .
Historie
Opprinnelsen til GPFS er filsystemet Tiger Shark, et prosjekt fra IBMs Almaden Research Center tidlig i 1993 , selv om den første kommersielle versjonen av GPFS ble publisert i 1998 for AIX - operativsystemet .
I utgangspunktet er GPFS designet for å støtte de høye overføringshastighetene som kreves av multimedieapplikasjoner. Dette designet viste seg å være godt egnet for vitenskapelig databehandling.
Arkitektur
GPFS-filsystemet består av et sett med datamaskiner som danner en GPFS-klynge. Noen av klyngemedlemmene gir fysiske disker tilgjengelig for alle noder i systemet. Inkludering og ekskludering av medlemmer av klyngen kan gjøres i drift.
Når en node utfører en operasjon på filsystemet, distribueres dataene i striper ("striping") og lagres i flere av maskinene som fungerer som disker. På denne måten oppnås større ytelse ved å få tilgang til de forskjellige blokkene parallelt, høy tilgjengelighet (informasjon kan lagres på disker til to eller flere servere), gjenoppretting ved feil, sikkerhet, DMAPI , hierarkisk lagringshåndtering HSM og administrasjon av ILM informasjons livssyklus .
Inkluderingen av en ny diskserver forutsetter en forbedring i ytelsen ved å redistribuere informasjonen, noe som tillater et høyere nivå av parallellitet i tilgang.