Veri sanallaştırma - Data virtualization
Veri sanallaştırma , bir uygulamanın verinin kaynağında nasıl biçimlendirildiği veya fiziksel olarak nerede bulunduğu gibi teknik ayrıntılara ihtiyaç duymadan verileri almasına ve işlemesine olanak tanıyan ve tek bir müşteri görünümü (veya tüm verilerin tek bir görünümü).
Geleneksel ayıklama, dönüştürme, yükleme ("ETL") işleminin aksine, veriler yerinde kalır ve veriler için kaynak sisteme gerçek zamanlı erişim verilir. Bu, veri hataları riskini, veriyi hareket ettiren ve hiçbir zaman kullanılamayacak olan iş yükünü azaltır ve verilere tek bir veri modeli empoze etmeye çalışmaz (heterojen veri örneği, birleşik bir veritabanı sistemidir ). Teknoloji aynı zamanda işlem verisi güncellemelerinin kaynak sistemlere yazılmasını da destekler. Kaynak ve tüketici biçimlerindeki ve anlambilimdeki farklılıkları gidermek için çeşitli soyutlama ve dönüştürme teknikleri kullanılır. Bu kavram ve yazılım, veri entegrasyonunun bir alt kümesidir ve iş zekası , hizmet odaklı mimari veri hizmetleri, bulut bilişim , kurumsal arama ve ana veri yönetimi içinde yaygın olarak kullanılır .
Veri sanallaştırma ve veri ambarı
Bazı kurumsal ortamlar, birden çok veri ambarı , veri martları ve/veya veri gölleri dahil olmak üzere farklı veri kaynaklarıyla doludur , ancak bir Veri Ambarı doğru bir şekilde uygulanırsa benzersiz ve tek bir doğru kaynağı olmalıdır . Veri sanallaştırma, tamamen yeni bir entegre fiziksel veri platformu oluşturmak zorunda kalmadan veri ambarları, veri pazarları ve veri gölleri arasında verimli bir şekilde köprü kurabilir. Mevcut veri altyapısı, temel işlevlerini yerine getirmeye devam ederken, veri sanallaştırma katmanı yalnızca bu kaynaklardan gelen verilerden yararlanır. Veri sanallaştırmanın bu yönü, onu mevcut tüm veri kaynaklarını tamamlayıcı hale getirir ve kurumsal verilerin kullanılabilirliğini ve kullanımını artırır.
Veri sanallaştırma, ETL'ye ve veri ambarına bir alternatif olarak da düşünülebilir, ancak performans açısından çok büyük bir veri ambarı için gerçekten önerilmez. Veri sanallaştırma, doğası gereği, kapsamlı ETL ve veri depolama ile büyük bir veri projesine girişmek zorunda kalmadan birden çok kaynaktan hızlı ve zamanında içgörüler üretmeyi amaçlar. Ancak, veri sanallaştırma, veri ambarı gereksinimlerine de hizmet edecek şekilde genişletilebilir ve uyarlanabilir. Bu, doğru veri sanallaştırma, entegrasyon ve depolama stratejilerini ve altyapı/performans optimizasyonlarını (örn. akış, bellek içi, hibrit depolama) birleştirmek için planlama ve tasarımın yanı sıra veri depolama ve geçmiş gereksinimlerinin anlaşılmasını gerektirecektir.
Örnekler
- İngiltere merkezli cep telefonu perakende zinciri Carphone Warehouse'un Avrupa operasyonlarının ticari adı olan The Phone House, Denodo'nun İspanyol yan kuruluşunun işlem sistemleri ile mobil operatörlerin Web tabanlı sistemleri arasında veri sanallaştırma teknolojisini uyguladı.
- Novartis , araştırmacılarının hem dahili hem de harici kaynaklardan gelen verileri aranabilir bir sanal veri deposunda hızlı bir şekilde birleştirmesini sağlamak için TIBCO'nun veri sanallaştırma aracını uyguladı .
- Depolamadan bağımsız Birincil Veri (feshedilmiş, Hammer.space olarak yeniden doğmuş), uygulamaların, sunucuların ve istemcilerin, doğrudan bağlı, ağa bağlı, özel ve genel bulut depolama arasında geçiş yapılırken verilere şeffaf bir şekilde erişmesini sağlayan bir veri sanallaştırma platformuydu. .
- Bağlantılı Veriler , ODBC , JDBC , OLE DB , ADO.NET , SOA kullanarak çeşitli arka uç veri kaynaklarına dahili olarak bağlı olan bir sanal veritabanı katmanına bağlantı sağlamak için tek bir köprü tabanlı Veri Kaynağı Adı ( DSN ) kullanabilir. -stil hizmetler ve/veya REST kalıpları.
- Veritabanı sanallaştırması , benzer bir sanal veritabanı katmanına bağlantı sağlamak için tek bir ODBC tabanlı DSN kullanabilir.
- Alluxio , başlamış bir açık kaynak sanal dağıtık dosya sistemi (VDFS), Berkeley California Üniversitesi 'nin AMPLab . Sistem, çeşitli dosya sistemlerinden ve nesne depolarından verileri soyutlar.
işlevsellik
Veri Sanallaştırma yazılımı, aşağıdaki yeteneklerin bir kısmını veya tamamını sağlar:
- Soyutlama – Konum, depolama yapısı, API, erişim dili ve depolama teknolojisi gibi depolanan verilerin teknik yönlerini soyutlayın.
- Sanallaştırılmış Veri Erişimi – Farklı veri kaynaklarına bağlanın ve bunları ortak bir mantıksal veri erişim noktasından erişilebilir hale getirin.
- Dönüşüm – Tüketici kullanımı için kaynak verileri dönüştürün, kaliteyi iyileştirin, yeniden biçimlendirin, toplayın vb.
- Veri Federasyonu – Birden çok kaynak sistemdeki sonuç kümelerini birleştirin.
- Veri Teslimi – Sonuç kümelerini, istendiğinde istemci uygulaması veya kullanıcılar tarafından yürütülen görünümler ve/veya veri hizmetleri olarak yayınlayın.
Veri sanallaştırma yazılımı, geliştirme, çalıştırma ve/veya yönetim için işlevler içerebilir. Bir meta veri motoru , bir etki alanı içinde kullanılan veriler ve meta veriler (verilerle ilgili veriler) hakkındaki bilgileri toplar, depolar ve analiz eder.
Avantajlar şunları içerir:
- Veri hataları riskini azaltın
- Verileri hareket ettirmeyerek sistemlerin iş yükünü azaltın
- Gerçek zamanlı olarak verilere erişim hızını artırın
- Orta katman yerine veri kaynağına itilen sorgu işlemeye izin verir
- Çoğu sistem, kaynak sistemlere erişimi olan son kullanıcılar tarafından self servis sanal veritabanları oluşturulmasını sağlar.
- Politikaların kullanımı yoluyla yönetişimi artırın ve riski azaltın
- Gerekli veri depolamayı azaltın
Dezavantajları şunları içerir:
- Operasyonel sistemlerin yanıt süresini etkileyebilir, özellikle beklenmeyen kullanıcı sorgularıyla başa çıkmak için yetersiz ölçeklendirildiyse veya erken ayarlanmadıysa.
- Heterojen bir veri modeli dayatmaz, yani Veri Federasyonu ve verilerin iş anlayışıyla birleştirilmedikçe, kullanıcının verileri yorumlaması gerekir.
- Paylaşılan hizmetlerle ilgili bütçeleme sorunlarından kaçınmak için tanımlanmış bir Yönetişim yaklaşımı gerektirir
- Verilerin geçmiş anlık görüntülerini kaydetmek için uygun değildir. Bunun için bir veri ambarı daha iyidir
- Değişiklik yönetimi "herhangi bir değişikliğin tüm uygulamalar ve aynı sanallaştırma kitini paylaşan kullanıcılar tarafından kabul edilmesi gerektiğinden, büyük bir ek yüktür"
- Tasarımcılar performans değerlendirmelerini her zaman akıllarında tutmalıdır.
Kullanımdan kaçının (bkz: https://www.denodo.com ):
- Operasyonel Veri Sistemlerine erişim için (Performans ve Operasyonel Bütünlük konuları)
- Kuruluşun tüm verilerini birleştirmek veya merkezileştirmek için (Güvenlik ve bilgisayar korsanlığı sorunları)
- Çok büyük sanal Veri ambarı oluşturmak için (Performans sorunları)
- Bir ETL süreci olarak (Yönetim ve performans sorunları)
- Sanallaştırılacak yalnızca bir veya iki veri kaynağınız varsa
Tarih
Kurumsal bilgi entegrasyonu (EII) (ilk olarak Metamatrix tarafından türetilmiştir), şimdi Red Hat JBoss Veri Sanallaştırma olarak bilinir ve federe veritabanı sistemleri , bazı satıcılar tarafından veri sanallaştırmanın temel bir öğesini tanımlamak için kullanılan terimlerdir: federe bir sistemde ilişkisel JOIN'ler oluşturma yeteneği. GÖRÜŞ.
Ayrıca bakınız
- Veri entegrasyonu
- Kurumsal bilgi entegrasyonu (EII)
- Ana veri yönetimi
- Veri Federasyonu
- farklı sistem
Referanslar
daha fazla okuma
- Veri Sanallaştırma: İş Çevikliğini Elde Etmek için Geleneksel Veri Entegrasyonunun Ötesine Geçmek, Judith R. Davis ve Robert Eve
- İş Zekası Sistemleri için Veri Sanallaştırma: Veri Ambarı için Veri Entegrasyonunda Devrim Yaratıyor, Rick van der Lans
- Veri Entegrasyon Planı ve Modelleme: Ölçeklenebilir ve Sürdürülebilir Bir Mimari için Teknikler, Anthony Giordano