Toplama işlevi - Aggregate function
Gelen veri tabanı yönetim , bir toplama işlevi ya da toplama işlevi a, fonksiyonu , birden çok satır değerleri tek oluşturmak üzere bir araya toplanır özet değeri .
Ortak toplama işlevleri şunları içerir:
Diğerleri şunları içerir:
- Nanmean ("nil" veya "null" olarak da bilinen NaN değerlerinin yok sayılması anlamına gelir)
- Stddev
Biçimsel olarak, bir toplama işlevi, girdi olarak bir alan grubu , bir multiset (torba) veya bir listesini bir giriş alanı ile ilgili I ve bir çıkış alanı arasında bir eleman verir O . Giriş ve çıkış etki alanları, için gibi aynı SUMolabilir veya için gibi farklı olabilir COUNT.
Toplama işlevleri, çeşitli programlama dillerinde , elektronik tablolarda ve ilişkisel cebirde yaygın olarak bulunur .
listaggOlarak tanımlanan fonksiyon, SQL: 2016 tek birleştirilmiş dizeye birden fazla satır standart veriler toplar.
Ayrıştırılabilir toplama işlevleri
Toplama işlevleri bir darboğaz sunar , çünkü potansiyel olarak tüm girdi değerlerine aynı anda sahip olmayı gerektirirler. Olarak dağıtılmış işlem , küçük parçalar halinde bu hesaplamaları bölmek ve genellikle, eser arzu edilir paralel işlem bir ile, bölme ve fethet algoritması .
Bazı toplama işlevleri, alt kümeler için toplamın hesaplanması ve ardından bu toplamaların toplanmasıyla hesaplanabilir; örnekler arasında COUNT, MAX, MIN,ve SUM. Diğer durumlarda toplam, alt kümeler için yardımcı sayıların hesaplanması, bu yardımcı sayıların toplanması ve son olarak sonunda toplam sayının hesaplanmasıyla hesaplanabilir; örnekler arasında AVERAGE(toplam ve sayı izleme, sonunda bölme) ve RANGE(maks ve min izleme, sonunda çıkarma) bulunur. Diğer durumlarda, bazı durumlarda yaklaşımlar dağıtılabilse de, tüm küme bir kerede analiz edilmeden toplam hesaplanamaz; örnekler arasında DISTINCT COUNT, MEDIAN,ve MODE.
Bu tür işlevlere ayrıştırılabilir toplama işlevleri veya ayrıştırılabilir toplama işlevleri denir . En basit şekilde ifade edilebilir kendini ayrışabilir toplama işlevlerine bu fonksiyon olarak tanımlandığı gibidir, f bir olduğu gibi birleştirme operatörü bu tür
çoklu kümelerin birleşimi nerede (bkz. monoid homomorfizmi ).
Örneğin SUM:
- , bir singleton için;
- , birleştirmenin basitçe ekleme olduğu anlamına gelir .
COUNT:
- ,
- .
MAX:
- ,
- .
MIN:
- ,
- .
Kendi kendine ayrıştırılabilen toplama işlevlerinin ayrı ayrı uygulanarak birleştirilebileceğini (resmen, ürünü alarak) unutmayın, böylece örneğin iki sayı izlenerek hem SUMve hem COUNTde aynı anda hesaplanabilir .
Daha genel olarak, ayrıştırılabilir bir toplama fonksiyonu f , bir nihai fonksiyon g ve kendi kendine ayrıştırılabilir bir toplama fonksiyonu h , ' nin bileşimi olarak ifade edilebilen bir fonksiyon olarak tanımlanabilir . Örneğin, = / ve = - .
AVERAGESUMCOUNTRANGEMAXMIN
Gelen MapReduce Karışık faz bilinen önceki çerçeve, bu adımlar InitialReduce (bireysel kayıt / tekil seti değeri), (iki toplamalardan ikili birleştirme) birleştirin ve FinalReduce (yardımcı değerlerine son işlev), ve terkibi bozulabilir agregasyonu hareketli şekilde bilinmektedir Bir InitialReduce adımı olarak,
Ayrıştırılabilir toplama işlevleri, toplama sorgularının temel veriler yerine OLAP küpündeki önceden hesaplanmış sonuçlar üzerinde hesaplanmasına olanak tanıdığından , çevrimiçi analitik işlemede (OLAP) önemlidir . Örneğin, destek kolaydır ve bu OLAP küp her bir hücre için hesaplanır ve daha sonra özetlenebilir yana ( "sıvadı"), OLAP, ancak destek zor olduğu ayrı ayrı her görünüm için hesaplanan gibi olmalıdır, .
COUNT, MAX, MIN,SUMMEDIAN
Diğer ayrıştırılabilir toplama işlevleri
Toplam verilerden ortalama ve standart sapmayı hesaplamak için, her grup için mevcut olması gerekir: değerlerin toplamı (Σx i = TOPLA(x)), değer sayısı (N=COUNT(x)) ve her grubun değerlerinin (Σx i 2 =SUM(x 2 )) karelerinin toplamı .
AVG:
- .
veya
- .
veya yalnızca SAYI(X)=COUNT(Y) ise
- .
SUM(x2): Grupların Standart Sapmasını hesaplamak için değerlerin karelerinin toplamı önemlidir.
STDDEV:
Tüm noktalarda eşit olasılıklara sahip sonlu bir popülasyon için,
Bu, standart sapmanın, değerlerin karelerinin ortalaması ile ortalama değerin karesi arasındaki farkın kareköküne eşit olduğu anlamına gelir.
- .
- .
Ayrıca bakınız
- Çapraz tablo aka Acil durum tablosu
- Veri delme
- Veri madenciliği
- Veri işleme
- Ayıkla, dönüştür, yükle
- Katlama (üst düzey işlev)
- (SQL) , SQL yan tümcesine göre gruplandır
- OLAP küpü
- Çevrimiçi analitik işleme
- Pivot tablo
- ilişkisel cebir
- Bölünemez mallar üzerindeki fayda fonksiyonları#Fayda fonksiyonlarının toplamları
- Analiz için XML
- ToplamaIQ
Referanslar
alıntılar
bibliyografya
- Yu, Yuan; Gunda, Pradeep Kumar; Isard, Michael (2009). Veri paralel bilgi işlem için dağıtılmış toplama: arayüzler ve uygulamalar . ACM SIGOPS 22. İşletim sistemleri ilkeleri sempozyumu. ACM . s. 247–260. doi : 10.1145/1629575.1629600 .
- İsa, Paulo; Baquero, Carlos; Almeida, Paulo Sergio (2011). "Dağıtılmış Veri Toplama Algoritmaları Araştırması". arXiv : 1110.0725 [ cs.DC ].
- Zhang, Chao (2017). Devasa Paralel Hesaplamada Simetrik ve Asimetrik Toplama Fonksiyonu (Teknik rapor).
daha fazla okuma
- Grabisch, Michel; Marichal, Jean-Luc; Mesar, Radko; Pap, Ender (2009). Toplama işlevleri . Matematik Ansiklopedisi ve Uygulamaları. 127 . Cambridge: Cambridge Üniversitesi Yayınları . ISBN'si 978-0-521-51926-7. Zbl 1196.00002 .
- Oracle Toplama İşlevleri: MAX, MIN, COUNT, SUM, AVG Örnekleri