Database distribuito - Distributed database
Un database distribuito è un database in cui i dati vengono archiviati in diverse posizioni fisiche. Può essere archiviato in più computer situati nella stessa posizione fisica (ad esempio un data center); o forse disperso su una rete di computer interconnessi. A differenza dei sistemi paralleli , in cui i processori sono strettamente collegati e costituiscono un unico sistema di database, un sistema di database distribuito è costituito da siti liberamente accoppiati che non condividono componenti fisici.
Gli amministratori di sistema possono distribuire raccolte di dati (ad esempio in un database) su più posizioni fisiche. Un database distribuito può risiedere su server di rete organizzati o computer indipendenti decentralizzati su Internet , su intranet o extranet aziendali o su altre reti dell'organizzazione . Poiché i database distribuiti archiviano i dati su più computer, i database distribuiti possono migliorare le prestazioni nei siti di lavoro degli utenti finali consentendo l'elaborazione delle transazioni su molte macchine, invece di limitarsi a una.
Due processi assicurano che i database distribuiti rimangano aggiornati e attuali: replica e duplicazione .
- La replica implica l'utilizzo di software specializzato che cerca i cambiamenti nel database distributivo. Una volta identificate le modifiche, il processo di replica fa sì che tutti i database abbiano lo stesso aspetto. Il processo di replica può essere complesso e richiedere molto tempo, a seconda delle dimensioni e del numero dei database distribuiti. Questo processo può anche richiedere molto tempo e risorse del computer.
- La duplicazione, d'altra parte, ha meno complessità. Identifica un database come master e quindi duplica quel database. Il processo di duplicazione viene normalmente eseguito in un momento prestabilito dopo le ore. Questo per garantire che ogni posizione distribuita abbia gli stessi dati. Nel processo di duplicazione, gli utenti possono modificare solo il database master. Ciò garantisce che i dati locali non verranno sovrascritti.
Sia la replica che la duplicazione possono mantenere aggiornati i dati in tutte le posizioni distributive.
Oltre alla replica e alla frammentazione del database distribuito, esistono molte altre tecnologie di progettazione del database distribuito. Ad esempio, tecnologie di database distribuito con autonomia locale, sincrono e asincrono. L'implementazione di queste tecnologie può e dipende dalle esigenze dell'azienda, dalla sensibilità / riservatezza dei dati archiviati nel database e dal prezzo che l'azienda è disposta a spendere per garantire la sicurezza , la coerenza e l' integrità dei dati .
Quando si discute dell'accesso ai database distribuiti, Microsoft preferisce il termine query distribuita , che definisce in modo specifico del protocollo come "[un'istruzione SELECT, INSERT, UPDATE o DELETE che fa riferimento a tabelle e set di righe da uno o più dati OLE DB esterni fonti ". Oracle fornisce una vista più incentrata sul linguaggio in cui le query distribuite e le transazioni distribuite fanno parte dell'SQL distribuito .
Guarda anche
- Database centralizzato
- Griglia di dati
- Cache distribuita
- Archivio dati distribuito
- Tabella hash distribuita
- Protocollo di instradamento
Riferimenti
- MT Özsu e P. Valduriez, Principles of Distributed Databases (3a edizione) (2011), Springer, ISBN 978-1-4419-8833-1
- Elmasri e Navathe, Fundamentals of database systems (3a edizione), Addison-Wesley Longman, ISBN 0-201-54263-3
- Oracle Database Administrator's Guide 10g (versione 1), http://docs.oracle.com/cd/B14117_01/server.101/b10739/ds_concepts.htm