close

Generelt parallell filsystem

Gå til navigasjon Gå til søk
IBM GPFS
utvikler IBM
Fullt navn IBM General Parallel File System
Støttede operativsystemer AIX , Linux , Windows Server
Introduksjon 1998 ( AIX )
Grenser
Maksimal fildimensjon 2 63 -1 byte
Maksimalt antall filer 2 31
Maksimal filnavnstørrelse 256UTF-8
Maksimal volumstørrelse 2 99 byte (4 PiB testet)
Karakteristisk
egenskaper POSIX
Filtilgangstillatelser POSIX og ACL (valgfritt)
gjennomsiktig kompresjon Nei
transparent kryptering Nei

General Parallel File System (GPFS) er et distribuert filsystem med høy ytelse utviklet av IBM . GPFS gir høyhastighets samtidig tilgang til applikasjoner som kjører på flere noder i en klynge ved å gi en visning av en delt disk mellom dem alle. Den største eksisterende konfigurasjonen var over 2000 noder.

Versjoner av GPFS finnes for AIX (siden 1998 ) og Linux (siden 2001 ) operativsystemer. Den er inkludert som en del av IBM System Cluster 1350 .

Siden starten har GPFS blitt brukt med suksess i en rekke forretningsapplikasjoner, inkludert: digitale tjenester, analysenettverk og skalerbare filtjenester. Fra mars 2008 ble den brukt av mange av superdatamaskinene som utgjør TOP500 , inkludert de to viktigste i Spania : Magerit og Marenostrum .

Historie

Opprinnelsen til GPFS er filsystemet Tiger Shark, et prosjekt fra IBMs Almaden Research Center tidlig i 1993 , selv om den første kommersielle versjonen av GPFS ble publisert i 1998 for AIX - operativsystemet .

I utgangspunktet er GPFS designet for å støtte de høye overføringshastighetene som kreves av multimedieapplikasjoner. Dette designet viste seg å være godt egnet for vitenskapelig databehandling.

Arkitektur

GPFS-filsystemet består av et sett med datamaskiner som danner en GPFS-klynge. Noen av klyngemedlemmene gir fysiske disker tilgjengelig for alle noder i systemet. Inkludering og ekskludering av medlemmer av klyngen kan gjøres i drift.

Når en node utfører en operasjon på filsystemet, distribueres dataene i striper ("striping") og lagres i flere av maskinene som fungerer som disker. På denne måten oppnås større ytelse ved å få tilgang til de forskjellige blokkene parallelt, høy tilgjengelighet (informasjon kan lagres på disker til to eller flere servere), gjenoppretting ved feil, sikkerhet, DMAPI , hierarkisk lagringshåndtering HSM og administrasjon av ILM informasjons livssyklus .

Inkluderingen av en ny diskserver forutsetter en forbedring i ytelsen ved å redistribuere informasjonen, noe som tillater et høyere nivå av parallellitet i tilgang.

Se også

Eksterne lenker