Numără date - Count data
În statistici , datele de numărare sunt un tip de date statistice , un tip de date în care observațiile pot lua doar valorile întregi non-negative {0, 1, 2, 3, ...} și unde aceste numere întregi apar din numărarea mai degrabă decât clasamentul . Tratamentul statistic al datelor de numărare este distinct de cel al datelor binare , în care observațiile pot lua doar două valori, reprezentate de obicei prin 0 și 1, și din datele ordinale , care pot fi, de asemenea, formate din numere întregi, dar în care valorile individuale cad pe scară arbitrară și este importantă doar clasificarea relativă
Numărați variabilele
O parte individuală a datelor de numărare este deseori denumită variabilă de numărare . Când o astfel de variabilă este tratată ca o variabilă aleatorie , distribuțiile binomiale Poisson , binomiale și negative sunt utilizate în mod obișnuit pentru a reprezenta distribuția sa.
Examinare grafică
Examinarea grafică a datelor de numărare poate fi ajutată de utilizarea transformărilor de date alese pentru a avea proprietatea de a stabiliza varianța eșantionului. În special, transformarea rădăcinii pătrate ar putea fi utilizată atunci când datele pot fi aproximate printr-o distribuție Poisson (deși alte transformări au proprietăți modest îmbunătățite), în timp ce o transformare sinus inversă este disponibilă atunci când este preferată o distribuție binomială .
Corelarea datelor de numărare cu alte variabile
Aici variabila de numărare ar fi tratată ca o variabilă dependentă . Metodele statistice, cum ar fi cele mai mici pătrate și analiza varianței, sunt concepute pentru a face față variabilelor dependente continue. Acestea pot fi adaptate pentru a face față datelor de numărare utilizând transformări de date, cum ar fi transformarea rădăcinii pătrate , dar astfel de metode au mai multe dezavantaje; în cel mai bun caz sunt aproximative și estimează parametri care sunt adesea greu de interpretat.
Distribuția Poisson poate sta la baza unor analize ale datelor de numărare și în acest caz poate fi utilizată regresia Poisson . Acesta este un caz special al clasei de modele liniare generalizate care conține, de asemenea, forme specifice de model capabile să utilizeze distribuția binomială ( regresie binomială , regresie logistică ) sau distribuția binomială negativă în care sunt încălcate ipotezele modelului Poisson, în special atunci când intervalul valorilor de numărare este limitat sau atunci când este prezentă supra-dispersia .
Vezi si
Lecturi suplimentare
- Cameron, AC ; Trivedi, PK (2013). Analiza de regresie a numărului de date (ediția a doua). Cambridge University Press. ISBN 978-1-107-66727-3.
- Hilbe, Joseph M. (2011). Regresia binomială negativă (ed. A doua). Cambridge University Press. ISBN 978-0-521-19815-8.
- Winkelmann, Rainer (2008). Analiza econometrică a datelor de numărare (ediția a cincea). Springer. doi : 10.1007 / 978-3-540-78389-3 . ISBN 978-3-540-77648-2.