Funkční boxplot - Functional boxplot

Ve statistické grafice je funkční boxplot informačním průzkumným nástrojem, který byl navržen pro vizualizaci funkčních dat. Analogicky jako u klasického boxplotu jsou popisné statistiky funkčního boxplotu: obálka 50% centrální oblasti, střední křivka a maximální ne-odlehlá obálka.

Chcete-li vytvořit funkční boxplot, je prvním krokem uspořádání dat. Při analýze funkčních dat je každé pozorování skutečnou funkcí, proto se liší od klasického boxplotu, kde jsou data jednoduše řazena od nejmenší hodnoty vzorku po největší, ve funkčním boxplotu jsou funkční data, např. Křivky nebo obrázky, řazena pojem hloubky pásma nebo upravená hloubka pásma. Umožňuje objednávat funkční data z centra ven a zavádí tak opatření k definování funkčních kvantilů a ústřednosti nebo odlehlosti pozorování. Díky řadám funkčních dat je funkční boxplot přirozeným rozšířením klasického boxplot.

Konstrukce

V klasickém boxplotu představuje samotný box prostředních 50% dat. Vzhledem k tomu, že uspořádání dat ve funkčním boxplotu je od středu směrem ven, je 50% centrální oblast definována pásmem ohraničeným 50% nejhlubších nebo nejcentrálnějších pozorování. Hranice 50% centrální oblasti je definována jako obálka představující pole v klasickém boxplotu. Tato 50% centrální oblast je tedy analogií k „ mezikvartilnímu rozsahu “ (IQR) a poskytuje užitečnou indikaci šíření středních 50% křivek. Toto je robustní rozsah pro interpretaci, protože 50% centrální oblast není ovlivněna odlehlými hodnotami nebo extrémními hodnotami a poskytuje méně zaujatou vizualizaci šíření křivek. Pozorování v rámečku označuje medián nebo nejcentrálnější pozorování, což je také robustní statistika pro měření centrality.

„Vousy“ boxplot jsou svislé čáry grafu sahající od boxu a označující maximální obálku datové sady kromě odlehlých hodnot.

Detekce odlehlých hodnot

Odlehlé hodnoty lze detekovat ve funkčním boxplotu pomocí 1,5násobku 50% empirického pravidla centrální oblasti, analogického s empirickým pravidlem 1,5 IQR pro klasické boxploty. Ploty se získají nafouknutím obálky 50% centrální oblasti o 1,5násobek výšky 50% centrální oblasti. Jakákoli pozorování mimo ploty jsou označena jako potenciální odlehlé hodnoty. Když je každé pozorování jednoduše bod, funkční boxplot degeneruje na klasický boxplot a liší se od bodových boxplotů.

Vylepšený funkční boxplot

Zavedením konceptu centrálních regionů lze funkční boxplot zobecnit na vylepšený funkční boxplot, kde je poskytnuto také 25% a 75% centrálních regionů.

Plošný boxplot

Na časoprostorová data lze nahlížet jako na časovou křivku v každém prostorovém umístění nebo jako prostorovou plochu v každém okamžiku. V druhém případě lze k objednání povrchů vzorků použít hloubku povrchového pásma založenou na objemu a vede k trojrozměrnému povrchovému boxplotu s podobnými charakteristikami jako funkční boxploty. Podobně jsou ploty získány 1,5násobkem pravidla 50% centrální oblasti. Jakýkoli povrch mimo ploty je označen jako krajní kandidáti. Povrchový boxplot je přirozeným rozšířením funkčního boxplotu na R 3 .

Příklady

Statistický kód

Příkaz fbplot pro funkční boxploty je v balíčku fda R a je k dispozici také kód MATLAB .

Viz také

Reference