IBM's generelle parallelle filsystem

General Parallel File System ( GPFS ) er et klyngefilsystem fra IBM . Det fremkom fra flere forskningsprojekter om parallelle arbejdende filsystemer og blev og sælges under flere handelsnavne:

  • IBM's generelle parallelle filsystem
  • Elastisk opbevaring
  • Spektrumskala

historie

GPFS opstod fra IBM-forskningsprojekterne Tiger Shark File System og Vesta File System og blev oprindeligt omtalt som et multimediefilsystem , som stadig findes i interne navne i dag. Det viste sig hurtigt, at GPFS er særligt velegnet til højtydende computere på grund af sin parallelle arkitektur. I 1998 optrådte GPFS som et officielt IBM-produkt og efterfølgeren til Vesta / PIOFS som et POSIX- kompatibelt filsystem.

GPFS blev eller blev brugt i supercomputere ASCI White og ASC PurpleLawrence Livermore National Laboratory . Det blev senere portet til andre operativsystemer:

Andre netværksprotokoller såsom CIFS blev understøttet. Oprindeligt et filsystem bag store lagerinstallationer blev det senere solgt som et softwareprodukt uafhængigt af hardwaren. Funktioner såsom delt intet klynger er blevet tilføjet for nylig. Den 14. juli 2014 annoncerede IBM en skytjeneste kaldet Elastic Storage . Den 17. februar 2015 omdøbte IBM GPFS til Spectrum Scale .

GPFS i supercomputing

GPFS bruges som et klyngefilsystem med høj læse / skrive båndbredde i flere installationer på TOP500 supercomputerlisten, eksempler:

Funktioner

Integrerede lagersystemer fra IBM bestående af hardware og software med GPFS under Linux-operativsystemet er:

GPFS / Spectrum Scale har følgende funktionelle egenskaber:

  • Flere NAS- computere kan montere et klyngevolumen på samme tid (parallelt) til skrivning, så filsystemet er skalerbart for et stort antal klienter.
  • Striping og dermed parallel læsning og skrivning understøttes på niveauet for masselagringsenheden og individuelle filer. Denne parallelitet muliggør opnåelse af meget høje gennemstrømningshastigheder.
  • Distribueret låsemanager : Parallel skrivning til et filsystem er muliggjort af det faktum, at en fil kun kan skrives ved en proces ad gangen
  • Metadata og data kan distribueres på forskellige diske for at forbedre ydeevnen
  • Flere GPFS-servere (også kaldet noder) fungerer som en meget tilgængelig klynge, fejl opfanges
  • GPFS kan også være baseret på princippet i version 4.1 delt-intet klyngearbejde (FPO - File Placement Optimizer) og kan således som HDFS arbejde
  • meget store grænser for filstørrelse (8 EB ), bibliotekstørrelse, filsystemstørrelse (8 YB ), antal filer pr. filsystem (2 ^ 64)
  • Understøttelse af HSM / hierarkisk lagerstyring
  • diskenhederne kan deles med CIFS og NFS- protokollen på samme tid, fra version 4.1 også som Hadoop distribueret filsystem.
  • Adgangsretskontrol fungerer for NFS (for Unix-systemer) med POSIX-filrettigheder og for CIFS (Windows-systemer) med ACL'er . Disse filadgangsrettigheder kan kontrolleres uafhængigt af hinanden
  • Filsystemet fungerer i henhold til copy-on-write- princippet. I lighed med Windows "skygge kopier" kan snapshots fås via enhver eksporteret mappe, både via NFS og via CIFS
  • Asynkron replikering mellem forskellige GPFS-diskenheder er mulig (Active File Management)

Weblinks

Individuelle beviser

  1. ^ FAST 2002-konference om fil- og lagringsteknologi. Hentet 30. oktober 2017 .
  2. ^ ASCI Lilla. Hentet 30. oktober 2017 .
  3. Optimering af filplacering. Hentet 30. oktober 2017 .
  4. Meddelelse om elastisk opbevaring. Hentet 27. januar 2018 .