Eksponentiel distribution - Exponential distribution

Eksponentiel
	Sandsynlighedstæthedsfunktion
	Kumulativ fordelingsfunktion
Parametre	sats eller omvendt skala
Support
PDF
CDF
Kvantil
Betyde
Median
Mode
Variation
Skævhed
Eks. kurtosis
Entropi
MGF
CF
Fisher oplysninger
Kullback-Leibler divergens

I sandsynlighedsregning og statistik , den eksponentielle fordeling er sandsynlighedsfordelingen af tiden mellem begivenhederne i en Poisson punkt proces , det vil sige, en proces, hvor begivenheder forekommer kontinuerligt og uafhængigt ved en konstant gennemsnitlig hastighed. Det er et særligt tilfælde af gammafordelingen . Det er den kontinuerlige analog af den geometriske fordeling , og det har nøgleegenskaben at være hukommelsesløs . Udover at blive brugt til analyse af Poisson -punktprocesser findes den i forskellige andre sammenhænge.

Den eksponentielle fordeling er ikke den samme som klassen af eksponentielle fordelingsfamilier, som er en stor klasse af sandsynlighedsfordelinger, der inkluderer den eksponentielle fordeling som et af dens medlemmer, men også omfatter normalfordelingen , binomialfordelingen , gammafordelingen , Poisson , og mange andre.

Definitioner

Sandsynlighedstæthedsfunktion

Den Tæthedsfunktionen (pdf) af en eksponentiel fordeling er

{\ displaystyle f (x; \ lambda) = {\ begin {cases} \ lambda e^{-\ lambda x} & x \ geq 0, \\ 0 & x <0. \ end {cases}}}

Her er λ > 0 parameteren for fordelingen, ofte kaldet hastighedsparameteren . Fordelingen understøttes i intervallet $[0, \infty)$ . Hvis en tilfældig variabel X har denne fordeling, skriver vi $X ~ Exp (λ)$ .

Den eksponentielle fordeling udviser uendelig delbarhed .

Kumulativ fordelingsfunktion

Den kumulative fordelingsfunktion er givet af

{\ displaystyle F (x; \ lambda) = {\ begin {cases} 1-e^{-\ lambda x} & x \ geq 0, \\ 0 & x <0. \ end {cases}}}

Alternativ parametrering

Den eksponentielle fordeling er undertiden parametriseret i forhold til skalaparameteren $β = 1/ λ$ , hvilket også er middelværdien:

{\ displaystyle f (x; \ beta) = {\ begin {cases} {\ frac {1} {\ beta}} e^{-x/\ beta} & x \ geq 0, \\ 0 & x <0. \ end {cases}} \ qquad \ qquad F (x; \ beta) = {\ begin {cases} 1-e^{-x/\ beta} & x \ geq 0, \\ 0 & x <0. \ end {cases}} }

Ejendomme

Gennemsnit, varians, øjeblikke og median

Middelværdien er sandsynlighedsmassecentret, det er det første øjeblik .

Medianen er forbillede F ⁻¹ (1/2).

Middelværdien eller den forventede værdi af en eksponentielt fordelt tilfældig variabel X med hastighedsparameter λ er givet ved

{\ displaystyle \ operatorname {E} [X] = {\ frac {1} {\ lambda}}.}

I lyset af de givne eksempler nedenfor , det giver mening: hvis du modtager telefonopkald med en gennemsnitlig hastighed på 2 per time, så kan du forvente at vente en halv time for hvert opkald.

Den varians af X er givet ved

{\ displaystyle \ operatorname {Var} [X] = {\ frac {1} {\ lambda ^{2}}},}

så standardafvigelsen er lig med middelværdien.

De øjeblikke af X , for er givet ved ${\ displaystyle n \ in \ mathbb {N}}$

{\ displaystyle \ operatorname {E} \ left [X ^{n} \ right] = {\ frac {n!} {\ lambda ^{n}}}.}

De centrale øjeblikke i X , for er givet af ${\ displaystyle n \ in \ mathbb {N}}$

{\ displaystyle \ mu _ {n} = {\ frac {! n} {\ lambda ^{n}}} = {\ frac {n!} {\ lambda ^{n}}} \ sum _ {k = 0 }^{n} {\ frac {(-1)^{k}} {k!}}.}

hvor ! n er subfaktorien til n

Den mediane af X er givet ved

{\ displaystyle \ operatorname {m} [X] = {\ frac {\ ln (2)} {\ lambda}} <\ operatorname {E} [X],}

hvor

ln

refererer til den naturlige logaritme . Således er den absolutte forskel mellem middelværdi og median

{\ displaystyle \ left | \ operatorname {E} \ left [X \ right]-\ operatorname {m} \ left [X \ right] \ right | = {\ frac {1- \ ln (2)} {\ lambda }} <{\ frac {1} {\ lambda}} = \ operatorname {\ sigma} [X],}

i overensstemmelse med den median-gennemsnitlige ulighed .

Hukommelsesløshed

En eksponentielt fordelt tilfældig variabel T adlyder forholdet

{\ displaystyle \ Pr \ left (T> s+t \ mid T> s \ right) = \ Pr (T> t), \ qquad \ forall s, t \ geq 0.}

Dette kan ses ved at overveje den komplementære kumulative fordelingsfunktion :

{\ displaystyle {\ begin {align} \ Pr \ left (T> s+t \ mid T> s \ right) & = {\ frac {\ Pr \ left (T> s+t \ cap T> s \ right )} {\ Pr \ venstre (T> s \ højre)}} \\ [4pt] & = {\ frac {\ Pr \ venstre (T> s+t \ højre)} {\ Pr \ venstre (T> s \ højre)}} \\ [4pt] & = {\ frac {e^{-\ lambda (s+t)}} {e^{-\ lambda s}}} \\ [4pt] & = e^{ -\ lambda t} \\ [4pt] & = \ Pr (T> t). \ slut {justeret}}}

Når T fortolkes som ventetiden på et arrangement for at forekomme i forhold til nogle indledende tid, denne relation betyder, at hvis T er betinget af en manglende overholdelse af begivenheden over nogle indledende tidsperiode s , fordelingen af den resterende ventetid er det samme som den oprindelige ubetingede fordeling. For eksempel, hvis en hændelse ikke er sket efter 30 sekunder, er den betingede sandsynlighed for, at forekomsten vil tage mindst 10 sekunder mere, lig med den ubetingede sandsynlighed for at observere hændelsen mere end 10 sekunder efter den indledende tid.

Den eksponentielle fordeling og den geometriske fordeling er de eneste hukommelsesløse sandsynlighedsfordelinger .

Den eksponentielle fordeling er følgelig også nødvendigvis den eneste kontinuerlige sandsynlighedsfordeling, der har en konstant fejlfrekvens .

Quantiles

Tukey -kriterier for anomalier.

Den fraktil funktion (inverse kumulative fordelingsfunktion) for Exp ( λ ) er

{\ displaystyle F^{-1} (p; \ lambda) = {\ frac {-\ ln (1-p)} {\ lambda}}, \ qquad 0 \ leq p <1}

De kvartiler er derfor:

første kvartil: ln (4/3)/ λ
median : ln (2)/ λ
tredje kvartil: ln (4)/ λ

Og som en konsekvens er interkvartilområdet ln (3)/ λ .

Kullback – Leibler divergens

Den rettede Kullback - Leibler -divergens i nats af ("tilnærmelsesvis" distribution) fra ('sand' distribution) er givet af ${\ displaystyle e^{\ lambda}}$ ${\ displaystyle e^{\ lambda _ {0}}}$

{\ displaystyle {\ begin {align} \ Delta (\ lambda _ {0} \ parallel \ lambda) & = \ mathbb {E} _ {\ lambda _ {0}} \ left (\ log {\ frac {p_ { \ lambda _ {0}} (x)} {p _ {\ lambda} (x)}} \ højre) \\ & = \ mathbb {E} _ {\ lambda _ {0}} \ venstre (\ log {\ frac {\ lambda _ {0} e^{-\ lambda _ {0} x}} {\ lambda e^{-\ lambda x}}} \ right) \\ & = \ log (\ lambda _ {0} )-\ log (\ lambda)-(\ lambda _ {0}-\ lambda) E _ {\ lambda _ {0}} (x) \\ & = \ log (\ lambda _ {0})-\ log ( \ lambda)+{\ frac {\ lambda} {\ lambda _ {0}}}-1. \ end {align}}}

Maksimal entropifordeling

Blandt alle kontinuerlige sandsynlighedsfordelinger med understøttelse $[0, \infty)$ og middelværdi μ har den eksponentielle fordeling med λ = 1/ μ den største differentielle entropi . Med andre ord er det den maksimale entropi -sandsynlighedsfordeling for en tilfældig variant X, der er større end eller lig med nul, og for hvilken E [ X ] er fast.

Fordeling af minimum af eksponentielle tilfældige variabler

Lad X ₁ ,…, X _n være uafhængige eksponentielt fordelte tilfældige variabler med hastighedsparametre λ ₁ ,…, λ _n . Derefter

{\ displaystyle \ min \ venstre \ {X_ {1}, \ dotsc, X_ {n} \ højre \}}

er også eksponentielt fordelt med parameter

{\ displaystyle \ lambda = \ lambda _ {1} +\ dotsb +\ lambda _ {n}.}

Dette kan ses ved at overveje den komplementære kumulative fordelingsfunktion :

{\ displaystyle {\ begin {justeret} & \ Pr \ venstre (\ min \ {X_ {1}, \ dotsc, X_ {n} \}> x \ højre) \\ = {} & \ Pr \ venstre (X_ {1}> x, \ dotsc, X_ {n}> x \ højre) \\ = {} & \ prod _ {i = 1}^{n} \ Pr \ venstre (X_ {i}> x \ højre) \\ = {} & \ prod _ {i = 1}^{n} \ exp \ left (-x \ lambda _ {i} \ right) = \ exp \ left (-x \ sum _ {i = 1} ^{n} \ lambda _ {i} \ højre). \ slut {justeret}}}

Indekset for variablen, der opnår minimum, fordeles i henhold til den kategoriske fordeling

{\ displaystyle \ Pr \ left (k \ mid X_ {k} = \ min \ {X_ {1}, \ dotsc, X_ {n} \} \ right) = {\ frac {\ lambda _ {k}} { \ lambda _ {1} +\ dotsb +\ lambda _ {n}}}.}

Et bevis kan ses ved at lade . Derefter, ${\ displaystyle I = \ operatorname {argmin} _ {i \ in \ {1, \ dotsb, n \}} \ {X_ {1}, \ dotsc, X_ {n} \}}$

{\ displaystyle {\ begin {align} \ Pr (I = k) & = \ int _ {0}^{\ infty} \ Pr (X_ {k} = x) \ Pr (X_ {i \ neq k}> x) \, dx \\ & = \ int _ {0}^{\ infty} \ lambda _ {k} e^{-\ lambda _ {k} x} \ venstre (\ prod _ {i = 1, i \ neq k}^{n} e^{-\ lambda _ {i} x} \ right) dx \\ & = \ lambda _ {k} \ int _ {0}^{\ infty} e^{-\ venstre (\ lambda _ {1} +\ dotsb +\ lambda _ {n} \ højre) x} dx \\ & = {\ frac {\ lambda _ {k}} {\ lambda _ {1} +\ dotsb + \ lambda _ {n}}}. \ end {align}}}

Noter det

{\ displaystyle \ max \ {X_ {1}, \ dotsc, X_ {n} \}}

er ikke eksponentielt fordelt.

Fælles øjeblikke med eksponentiel ordrestatistik

Lad være uafhængige og identisk fordelte eksponentielle tilfældige variabler med hastighedsparameter λ . Lad betegne den tilsvarende ordrestatistik . For , det fælles øjeblik af ordren statistik og er givet af ${\ displaystyle X_ {1}, \ dotsc, X_ {n}}$ ${\ displaystyle n}$ ${\ displaystyle X _ {(1)}, \ dotsc, X _ {(n)}}$ ${\ displaystyle i <j}$ ${\ displaystyle \ operatorname {E} \ left [X _ {(i)} X _ {(j)} \ right]}$ ${\ displaystyle X _ {(i)}}$ ${\ displaystyle X _ {(j)}}$

{\ displaystyle {\ begin {align} \ operatorname {E} \ left [X _ {(i)} X _ {(j)} \ right] & = \ sum _ {k = 0}^{j-1} {\ frac {1} {(nk) \ lambda}} \ operatorname {E} \ left [X _ {(i)} \ right]+\ operatorname {E} \ left [X _ {(i)}^{2} \ right ] \\ & = \ sum _ {k = 0}^{j-1} {\ frac {1} {(nk) \ lambda}} \ sum _ {k = 0}^{i-1} {\ frac {1} {(nk) \ lambda}}+\ sum _ {k = 0}^{i-1} {\ frac {1} {((nk) \ lambda)^{2}}}+\ venstre ( \ sum _ {k = 0}^{i-1} {\ frac {1} {(nk) \ lambda}} \ højre)^{2}. \ end {align}}}

Dette kan ses ved at påberåbe sig loven om total forventning og den hukommelsesløse egenskab:

{\ displaystyle {\ begin {align} \ operatorname {E} \ left [X _ {(i)} X _ {(j)} \ right] & = \ int _ {0}^{\ infty} \ operatorname {E} \ venstre [X _ {(i)} X _ {(j)} \ midt X _ {(i)} = x \ højre] f_ {X _ {(i)}} (x) \, dx \\ & = \ int _ {x = 0}^{\ infty} x \ operatorname {E} \ venstre [X _ {(j)} \ midt X _ {(j)} \ geq x \ højre] f_ {X _ {(i)}} (x ) \, dx && \ venstre ({\ textrm {siden}} ~ X _ {(i)} = x \ indebærer X _ {(j)} \ geq x \ højre) \\ & = \ int _ {x = 0}^ {\ infty} x \ left [\ operatorname {E} \ left [X _ {(j)} \ right]+x \ right] f_ {X _ {(i)}} (x) \, dx && \ left ({\ tekst {ved den hukommelsesløse ejendom}} \ højre) \\ & = \ sum _ {k = 0}^{j-1} {\ frac {1} {(nk) \ lambda}} \ operatorname {E} \ venstre [X _ {(i)} \ højre]+\ operatornavn {E} \ venstre [X _ {(i)}^{2} \ højre]. \ End {justeret}}}

Den første ligning følger af loven om total forventning . Den anden ligning udnytter det faktum, at når vi betinges , skal den følge det . Den tredje ligning er afhængig af den hukommelsesløse ejendom, der skal erstattes med . ${\ displaystyle X _ {(i)} = x}$ ${\ displaystyle X _ {(j)} \ geq x}$ ${\ displaystyle \ operatorname {E} \ left [X _ {(j)} \ mid X _ {(j)} \ geq x \ right]}$ ${\ displaystyle \ operatorname {E} \ left [X _ {(j)} \ right]+x}$

Summen af to uafhængige eksponentielle tilfældige variabler

Sandsynlighedsfordelingsfunktionen (PDF) af en sum af to uafhængige tilfældige variabler er sammenviklingen af deres individuelle PDF -filer . Hvis og er uafhængige eksponentielle tilfældige variabler med respektive frekvensparametre, og sandsynlighedstætheden for er givet ved ${\ displaystyle X_ {1}}$ ${\ displaystyle X_ {2}}$ ${\ displaystyle \ lambda _ {1}}$ ${\ displaystyle \ lambda _ {2},}$ ${\ displaystyle Z = X_ {1}+X_ {2}}$

{\ displaystyle {\ begin {align} f_ {Z} (z) & = \ int _ {-\ infty}^{\ infty} f_ {X_ {1}} (x_ {1}) f_ {X_ {2} } (z-x_ {1}) \, dx_ {1} \\ & = \ int _ {0}^{z} \ lambda _ {1} e^{-\ lambda _ {1} x_ {1}} \ lambda _ {2} e^{-\ lambda _ {2} (z-x_ {1})} \, dx_ {1} \\ & = \ lambda _ {1} \ lambda _ {2} e^{ -\ lambda _ {2} z} \ int _ {0}^{z} e^{(\ lambda _ {2}-\ lambda _ {1}) x_ {1}} \, dx_ {1} \\ & = {\ begin {cases} {\ dfrac {\ lambda _ {1} \ lambda _ {2}} {\ lambda _ {2}-\ lambda _ {1}}} \ venstre (e^{-\ lambda _ {1} z} -e^{-\ lambda _ {2} z} \ right) & {\ text {if}} \ lambda _ {1} \ neq \ lambda _ {2} \\ [4pt] \ lambda ^{2} ze ^{-\ lambda z} & {\ text {if}} \ lambda _ {1} = \ lambda _ {2} = \ lambda. \ end {cases}} \ end {align}} }

Entropien for denne distribution er tilgængelig i lukket form: forudsat (uden tab af generalitet), derefter

{\ displaystyle \ lambda _ {1}> \ lambda _ {2}}

{\ displaystyle {\ begin {justeret} H (Z) & = 1+ \ gamma +\ ln \ venstre ({\ frac {\ lambda _ {1}-\ lambda _ {2}} {\ lambda _ {1} \ lambda _ {2}}} \ højre)+\ psi \ venstre ({\ frac {\ lambda _ {1}} {\ lambda _ {1}-\ lambda _ {2}}} \ højre), \ end {align}}}

hvor er Euler-Mascheroni-konstanten , og er digamma-funktionen .

{\ displaystyle \ gamma}

{\ displaystyle \ psi (\ cdot)}

I tilfælde af parametre med samme hastighed er resultatet en Erlang -fordeling med form 2 og parameter, som igen er et specielt tilfælde af

gammadistribution .

{\ displaystyle \ lambda,}

Relaterede distributioner

Hvis så |

X - μ | ~ Exp (β).

{\ displaystyle X \ sim \ operatorname {Laplace} \ left (\ mu, \ beta ^{-1} \ right)}

Hvis X ~ Pareto (1, λ) log derefter ( X ) ~ Exp (λ).

Hvis X ~ SkewLogistic (θ), så .

{\ displaystyle \ log \ left (1+e^{-X} \ right) \ sim \ operatorname {Exp} (\ theta)}

Hvis X _i ~ U (0, 1) derefter

{\ displaystyle \ lim _ {n \ to \ infty} n \ min \ venstre (X_ {1}, \ ldots, X_ {n} \ højre) \ sim \ operatorname {Exp} (1)}

Den eksponentielle distribution er en grænse for en skaleret beta -distribution :

{\ displaystyle \ lim _ {n \ to \ infty} n \ operatorname {Beta} (1, n) = \ operatorname {Exp} (1).}

Eksponentiel distribution er et specielt tilfælde af type 3 Pearson distribution .

Hvis X ~ Exp (λ) og X _i ~ Exp (λ _i ) derefter:

${\ displaystyle kX \ sim \ operatorname {Exp} \ left ({\ frac {\ lambda} {k}} \ right)}$ , lukning under skalering med en positiv faktor.
1 + X ~ BenktanderWeibull (λ, 1), hvilket reducerer til en afkortet eksponentiel fordeling.
ke ^X ~ Pareto ( k , λ).
e ^−X ~ Beta (λ, 1).
1/ke ^X ~ PowerLaw ( k , λ)
${\ displaystyle {\ sqrt {X}} \ sim \ operatorname {Rayleigh} \ venstre ({\ frac {1} {\ sqrt {2 \ lambda}}} \ højre)}$ , Rayleigh -distributionen
${\ displaystyle X \ sim \ operatorname {Weibull} \ venstre ({\ frac {1} {\ lambda}}, 1 \ højre)}$ , Weibull -distributionen
${\ displaystyle X ^{2} \ sim \ operatorname {Weibull} \ venstre ({\ frac {1} {\ lambda ^{2}}}, {\ frac {1} {2}} \ højre)}$
μ - β log (λ X ) ∼ Gumbel (μ, β) .
${\ displaystyle \ lfloor X \ rfloor \ sim \ operatorname {Geometric} \ left (1-e^{-\ lambda} \ right)}$ , en geometrisk fordeling på 0,1,2,3, ...
${\ displaystyle \ lceil X \ rceil \ sim \ operatorname {Geometric} \ left (1-e^{-\ lambda} \ right)}$ , en geometrisk fordeling på 1,2,3,4, ...
Hvis også Y ~ Erlang ( n , λ) eller derefter ${\ displaystyle Y \ sim \ Gamma \ venstre (n, {\ frac {1} {\ lambda}} \ højre)}$ ${\ displaystyle {\ frac {X} {Y}}+1 \ sim \ operatorname {Pareto} (1, n)}$
Hvis også λ ~ Gamma ( k , θ) (form, skala parametrisering) derefter den marginale fordeling af X er Lomax ( k , 1 / θ), gamma blandingen
λ ₁X ₁ - λ ₂Y ₂ ~ Laplace (0, 1) .
min { X ₁ , ..., X _n } ~ Exp (λ ₁ + ... + λ _n ).
Hvis også λ _i = λ så:
- ${\ displaystyle X_ {1} +\ cdots +X_ {k} = \ sum _ {i} X_ {i} \ sim}$ Erlang ( k , λ) = Gamma ( k , λ ⁻¹ ) = Gamma ( k , λ) (i ( k , θ) og (α, β) parametrering henholdsvis) med et heltal form parameter k.
- X _i - X _j ~ Laplace (0, λ ⁻¹ ).
Hvis også X _i er uafhængige, så:
- ${\ displaystyle {\ frac {X_ {i}} {X_ {i}+X_ {j}}}}$ ~ U (0, 1)
- ${\ displaystyle Z = {\ frac {\ lambda _ {i} X_ {i}} {\ lambda _ {j} X_ {j}}}}$ har sandsynlighedstæthedsfunktion . Dette kan bruges til at opnå et

konfidensinterval for .

{\ displaystyle f_ {Z} (z) = {\ frac {1} {(z+1)^{2}}}}

{\ displaystyle {\ frac {\ lambda _ {i}} {\ lambda _ {j}}}}

Hvis også λ = 1:

${\ displaystyle \ mu-\ beta \ log \ left ({\ frac {e^{-X}} {1-e^{-X}}} \ right) \ sim \ operatorname {Logistic} (\ mu, \ beta)}$ , den logistiske fordeling
${\ displaystyle \ mu -\ beta \ log \ left ({\ frac {X_ {i}} {X_ {j}}} \ right) \ sim \ operatorname {Logistic} (\ mu, \ beta)}$
μ - σ log ( X ) ~ GEV (μ, σ, 0) .
Yderligere hvis så (

K-distribution )

{\ displaystyle Y \ sim \ Gamma \ venstre (\ alpha, {\ frac {\ beta} {\ alpha}} \ højre)}

{\ displaystyle {\ sqrt {XY}} \ sim \ operatorname {K} (\ alpha, \ beta)}

Hvis også λ = 1/2 så X ∼ χ²
₂; dvs. X har en chi-kvadratisk fordeling med 2 frihedsgrader . Derfor:

{\ displaystyle \ operatorname {Exp} (\ lambda) = {\ frac {1} {2 \ lambda}} \ operatorname {Exp} \ left ({\ frac {1} {2}} \ right) \ sim {\ frac {1} {2 \ lambda}} \ chi _ {2}^{2} \ Rightarrow \ sum _ {i = 1}^{n} \ operatorname {Exp} (\ lambda) \ sim {\ frac {1 } {2 \ lambda}} \ chi _ {2n}^{2}}

Hvis og ~

Poisson ( X ) derefter ( geometrisk fordeling )

{\ displaystyle X \ sim \ operatorname {Exp} \ left ({\ frac {1} {\ lambda}} \ right)}

{\ displaystyle Y \ mid X}

{\ displaystyle Y \ sim \ operatorname {Geometric} \ left ({\ frac {1} {1+ \ lambda}} \ right)}

Den Hoyt fordeling kan opnås fra eksponentiel fordeling og arcsinus fordeling

Andre relaterede distributioner:

Hyper-eksponentiel distribution -fordelingen, hvis tæthed er en vægtet sum af eksponentielle tætheder.
Hypoexponentiel distribution - fordelingen af en generel sum af eksponentielle tilfældige variabler.
exGaussian distribution - summen af en eksponentiel distribution og en normal distribution .

Statistisk slutning

Antag nedenfor, at tilfældig variabel X er eksponentielt fordelt med hastighedsparameter λ, og er

n uafhængige prøver fra X , med prøve middelværdi .

{\ displaystyle x_ {1}, \ dotsc, x_ {n}}

{\ displaystyle {\ bar {x}}}

Parameterestimering

Den maksimale sandsynlighedsestimator for λ er konstrueret som følger:

Den Likelihoodfunktionen for λ, givet en uafhængig og identisk fordelte prøve x = ( x ₁ , ..., x _n ) trækkes fra variable, er:

{\ displaystyle L (\ lambda) = \ prod _ {i = 1} ^{n} \ lambda \ exp (-\ lambda x_ {i}) = \ lambda ^{n} \ exp \ left (-\ lambda \ sum _ {i = 1} ^{n} x_ {i} \ højre) = \ lambda ^{n} \ exp \ venstre (-\ lambda n {\ overline {x}} \ højre),}

hvor:

{\ displaystyle {\ overline {x}} = {\ frac {1} {n}} \ sum _ {i = 1}^{n} x_ {i}}

er prøveværdien.

Afledningen af sandsynlighedsfunktionens logaritme er:

{\ displaystyle {\ frac {d} {d \ lambda}} \ ln L (\ lambda) = {\ frac {d} {d \ lambda}} \ venstre (n \ ln \ lambda -\ lambda n {\ overline {x}} \ right) = {\ frac {n} {\ lambda}}-n {\ overline {x}} \ {\ begin {cases}> 0 og 0 <\ lambda <{\ frac {1} { \ overline {x}}}, \\ [8pt] = 0, & \ lambda = {\ frac {1} {\ overline {x}}}, \\ [8pt] <0, & \ lambda> {\ frac {1} {\ overline {x}}}. \ End {cases}}}

Derfor er det maksimale sandsynlighedsestimat for satsparameteren:

{\ displaystyle {\ widehat {\ lambda}} _ {\ text {mle}} = {\ frac {1} {\ overline {x}}} = {\ frac {n} {\ sum _ {i} x_ { jeg}}}}

Dette er ikke en upartisk estimator af, selv om det

er en upartisk MLE -estimator for og fordelingsmiddelværdien.

{\ displaystyle \ lambda,}

{\ displaystyle {\ overline {x}}}

{\ displaystyle 1/\ lambda}

Bias for er lig med ${\ displaystyle {\ widehat {\ lambda}} _ {\ text {mle}}}$

{\ displaystyle b \ equiv \ operatorname {E} \ left [\ left ({\ widehat {\ lambda}} _ {\ text {mle}}-\ lambda \ right) \ right] = {\ frac {\ lambda} {n-1}}}

hvilket giver den bias-korrigerede maksimale sandsynlighedsestimator

{\ displaystyle {\ widehat {\ lambda}} _ {\ text {mle}}^{*} = {\ widehat {\ lambda}} _ {\ text {mle}}-{\ widehat {b}}.}

Omtrentlig minimizer af forventet kvadratfejl

Antag at du har mindst tre prøver. Hvis vi søger en minimizer af forventet gennemsnitlig kvadratisk fejl (se også: Bias -varians -afvejning ), der ligner det maksimale sandsynlighedsestimat (dvs. en multiplikativ korrektion til sandsynlighedsestimatet), har vi:

{\ displaystyle {\ widehat {\ lambda}} = \ venstre ({\ frac {n-2} {n}} \ højre) \ venstre ({\ frac {1} {\ bar {x}}} \ højre) = {\ frac {n-2} {\ sum _ {i} x_ {i}}}}

Dette er fremstillet af middelværdien og variansen af inverse-gammafordelingen : . ${\ textstyle {\ mbox {Inv-Gamma}} (n, \ lambda)}$

Fisher oplysninger

The Fisher information , betegnet , for en estimator af satsen parameter er givet som: ${\ displaystyle {\ mathcal {I}} (\ lambda)}$ ${\ displaystyle \ lambda}$

{\ displaystyle {\ mathcal {I}} (\ lambda) = \ operatorname {E} \ left [\ left. \ left ({\ frac {\ partial} {\ partial \ lambda}} \ log f (x; \ lambda) \ right)^{2} \ right | \ lambda \ right] = \ int \ left ({\ frac {\ partial} {\ partial \ lambda}} \ log f (x; \ lambda) \ right)^ {2} f (x; \ lambda) \, dx}

Tilslutning af distribution og løsning giver:

{\ displaystyle {\ mathcal {I}} (\ lambda) = \ int _ {0}^{\ infty} \ venstre ({\ frac {\ partial} {\ partial \ lambda}} \ log \ lambda e^{ -\ lambda x} \ højre)^{2} \ lambda e^{-\ lambda x} \, dx = \ int _ {0}^{\ infty} \ venstre ({\ frac {1} {\ lambda} } -x \ right)^{2} \ lambda e^{-\ lambda x} \, dx = \ lambda^{-2}.}

Dette bestemmer mængden af information, hver uafhængig prøve af en eksponentiel distribution bærer om den ukendte hastighedsparameter . ${\ displaystyle \ lambda}$

Tillidsintervaller

100 (1 - α)% konfidensinterval for hastighedsparameteren for en eksponentiel fordeling er givet ved:

{\ displaystyle {\ frac {2n} {{\ widehat {\ lambda}} \ chi _ {1-{\ frac {\ alpha} {2}}, 2n}^{2}}} <{\ frac {1 } {\ lambda}} <{\ frac {2n} {{\ widehat {\ lambda}} \ chi _ {{\ frac {\ alpha} {2}}, 2n}^{2}}}}

hvilket også er lig med:

{\ displaystyle {\ frac {2n {\ overline {x}}} {\ chi _ {1-{\ frac {\ alpha} {2}}, 2n}^{2}}} <{\ frac {1} {\ lambda}} <{\ frac {2n {\ overline {x}}} {\ chi _ {{\ frac {\ alpha} {2}}, 2n}^{2}}}}

hvor

χ 2 p, v

er

100 (p)

percentilen af chi-kvadratfordelingen med v- frihedsgrader , n er antallet af observationer af inter-ankomsttider i prøven, og x-bar er prøvegennemsnittet. En simpel tilnærmelse til de nøjagtige interval -endepunkter kan udledes ved hjælp af en normal tilnærmelse til

χ 2 p, v

fordeling. Denne tilnærmelse giver følgende værdier for et 95% konfidensinterval:

{\ displaystyle {\ begin {align} \ lambda _ {\ text {lower}} & = {\ widehat {\ lambda}} \ venstre (1-{\ frac {1.96} {\ sqrt {n}}} \ højre ) \\\ lambda _ {\ text {upper}} & = {\ widehat {\ lambda}} \ venstre (1+{\ frac {1.96} {\ sqrt {n}}} \ right) \ end {align} }}

Denne tilnærmelse kan være acceptabel for prøver, der indeholder mindst 15 til 20 elementer.

Bayesisk slutning

Den konjugat forud for den eksponentielle fordeling er gammafordelingen (hvoraf den eksponentielle fordeling er et særligt tilfælde). Følgende parameterisering af gamma -sandsynlighedsdensitetsfunktionen er nyttig:

{\ displaystyle \ operatorname {Gamma} (\ lambda; \ alpha, \ beta) = {\ frac {\ beta ^{\ alpha}} {\ Gamma (\ alpha)}} \ lambda ^{\ alpha -1} \ exp (-\ lambda \ beta).}

Den bageste fordeling p kan derefter udtrykkes i form af sandsynlighedsfunktionen defineret ovenfor og en gamma forud:

{\ displaystyle {\ begin {align} p (\ lambda) & \ propto L (\ lambda) \ Gamma (\ lambda; \ alpha, \ beta) \\ & = \ lambda ^{n} \ exp \ left (- \ lambda n {\ overline {x}} \ right) {\ frac {\ beta ^{\ alpha}} {\ Gamma (\ alpha)}} \ lambda ^{\ alpha -1} \ exp ( -\ lambda \ beta) \\ & \ propto \ lambda ^{(\ alpha +n) -1} \ exp (-\ lambda \ venstre (\ beta +n {\ overline {x}} \ højre)). \ end {align} }}

Nu er den bageste densitet p blevet specificeret op til en manglende normaliseringskonstant. Da den har form af en gamma pdf, kan denne let udfyldes, og man opnår:

{\ displaystyle p (\ lambda) = \ Gamma (\ lambda; \ alpha +n, \ beta +n {\ overline {x}}).}

Her kan hyperparameteret α tolkes som antallet af tidligere observationer og β som summen af de tidligere observationer. Det bageste middel her er:

{\ displaystyle {\ frac {\ alpha +n} {\ beta +n {\ overline {x}}}}}}

Forekomst og applikationer

Forekomst af begivenheder

Den eksponentielle fordeling forekommer naturligt, når længden af ankomsttiden i en homogen Poisson-proces beskrives .

Den eksponentielle fordeling kan ses som en kontinuerlig pendant til den geometriske fordeling , som beskriver antallet af Bernoulli -forsøg, der er nødvendige for, at en diskret proces kan ændre tilstand. I modsætning hertil beskriver den eksponentielle fordeling tiden for en kontinuerlig proces til at ændre tilstand.

I virkelige scenarier er antagelsen om en konstant hastighed (eller sandsynlighed pr. Tidsenhed) sjældent opfyldt. For eksempel varierer antallet af indgående telefonopkald alt efter tidspunktet på dagen. Men hvis vi fokuserer på et tidsinterval, hvor hastigheden er nogenlunde konstant, f.eks. Fra 14.00 til 16.00 i løbet af arbejdsdage, kan den eksponentielle fordeling bruges som en god omtrentlig model for tiden, indtil det næste telefonopkald kommer. Lignende forbehold gælder for følgende eksempler, der giver cirka eksponentielt fordelte variabler:

Tiden, indtil en radioaktiv partikel henfalder , eller tiden mellem klik på en Geiger -tæller
Den tid det tager før dit næste telefonopkald
Tiden til misligholdelse (ved betaling til virksomhedens gældsindehavere) i reduceret form kreditrisikomodellering

Eksponentielle variabler kan også bruges til at modellere situationer, hvor visse hændelser forekommer med en konstant sandsynlighed pr. Længdenhed, såsom afstanden mellem mutationer på en DNA -streng eller mellem roadkills på en given vej.

I køteori modelleres servicetiderne for agenter i et system (f.eks. Hvor lang tid det tager for en bankkasser osv. At betjene en kunde) ofte som eksponentielt distribuerede variabler. (Kundernes ankomst er f.eks. Også modelleret af Poisson -distributionen, hvis ankomsterne er uafhængige og distribueret ens.) Længden af en proces, der kan betragtes som en sekvens af flere uafhængige opgaver, følger Erlang -distributionen (som er distributionen af summen af flere uafhængige eksponentielt fordelte variabler). Pålidelighedsteori og pålidelighedsteknik gør også omfattende brug af den eksponentielle distribution. På grund af denne hukommelsesløse egenskab ved denne distribution er den velegnet til at modellere den konstante farehastighedsdel af badekarskurven, der bruges i pålidelighedsteorien. Det er også meget praktisk, fordi det er så let at tilføje fejlfrekvenser i en pålidelighedsmodel. Den eksponentielle fordeling er imidlertid ikke hensigtsmæssig til at modellere den samlede levetid for organismer eller tekniske anordninger, fordi "fejlfrekvensen" her ikke er konstant: flere fejl opstår for meget unge og for meget gamle systemer.

Monteret kumulativ eksponentiel distribution til årligt maksimalt 1-dages nedbør ved hjælp af CumFreq

I fysik , hvis du observerer en gas ved en bestemt temperatur og tryk i et ensartet tyngdefelt , følger højderne af de forskellige molekyler også en omtrentlig eksponentiel fordeling, kendt som den barometriske formel . Dette er en konsekvens af entropi -ejendommen nævnt nedenfor.

Inden for hydrologi bruges den eksponentielle fordeling til at analysere ekstreme værdier af sådanne variabler som månedlige og årlige maksimumværdier for daglig nedbør og vandløbsmængder.

Det blå billede illustrerer et eksempel på, hvordan den eksponentielle fordeling tilpasses årligt til maksimalt en-dages nedbør, der også viser 90% tillidsbæltet baseret på den binomiske fordeling . Nedbørsdataene er repræsenteret ved at plotte positioner som en del af den kumulative frekvensanalyse .

I ledelse af operationsstuer fordeles operationsvarigheden for en kategori af operationer uden typisk arbejdskontnet (som på et skadestue, der omfatter alle former for operationer).

Forudsigelse

Efter at have observeret en stikprøve af n datapunkter fra en ukendt eksponentiel distribution er en fælles opgave at bruge disse prøver til at forudsige fremtidige data fra den samme kilde. En almindelig forudsigende fordeling over fremtidige prøver er den såkaldte plug-in distribution, dannet ved at tilslutte et passende estimat for hastighedsparameteren λ til den eksponentielle densitetsfunktion. Et almindeligt estimatvalg er det, der er givet ved princippet om maksimal sandsynlighed, og ved hjælp af dette giver den forudsigelige tæthed over en fremtidig prøve x _{n +1} , betinget af de observerede prøver x = ( x ₁ , ..., x _n ) givet af

{\ displaystyle p _ {\ rm {ML}} (x_ {n+1} \ mid x_ {1}, \ ldots, x_ {n}) = \ left ({\ frac {1} {\ overline {x}} } \ højre) \ exp \ venstre (-{\ frac {x_ {n+1}} {\ overlinje {x}}} \ højre)}

Den bayesianske tilgang giver en forudsigelig fordeling, der tager højde for usikkerheden ved den estimerede parameter, selvom dette kan afgørende afhænge af valget af prior.

En forudsigende fordeling fri for spørgsmålene om valg af prioriteter, der opstår under den subjektive bayesianske tilgang er

{\ displaystyle p _ {\ rm {CNML}} (x_ {n+1} \ mid x_ {1}, \ ldots, x_ {n}) = {\ frac {n^{n+1} \ venstre ({\ overlinje {x}} \ højre)^{n}} {\ venstre (n {\ overlinje {x}}+x_ {n+1} \ højre)^{n+1}}},}

som kan betragtes som

en hyppig tillidsfordeling , opnået ved fordelingen af den afgørende mængde ; ${\ displaystyle {x_ {n+1}}/{\ overline {x}}}$
en profilforudsigende sandsynlighed, opnået ved at eliminere parameteren λ fra den fælles sandsynlighed for x _{n +1} og λ ved maksimalisering;
en objektiv Bayesiansk prediktiv posterior distribution, opnået ved hjælp af den ikke-informative Jeffreys forud for 1/ λ ;
betinget normaliseret maksimal sandsynlighed (CNML) forudsigende fordeling, ud fra informationsteoretiske overvejelser.

Nøjagtigheden af en forudsigelig fordeling kan måles ved hjælp af afstanden eller divergensen mellem den sande eksponentielle fordeling med hastighedsparameter, λ ₀ , og den forudsigelige fordeling baseret på prøven x . Den Kullback-Leibler divergens er en almindeligt anvendt, parametrering fri mål for forskellen mellem to fordelinger. Lad Δ ( λ ₀ || p ) betegne Kullback - Leibler -divergensen mellem en eksponentiel med hastighedsparameter λ ₀ og en forudsigelig fordeling p, det kan vises, at

{\ displaystyle {\ begin {align} \ operatorname {E} _ {\ lambda _ {0}} \ venstre [\ Delta (\ lambda _ {0} \ parallel p _ {\ rm {ML}}) \ højre] & = \ psi (n)+{\ frac {1} {n-1}}-\ log (n) \\\ operatorname {E} _ {\ lambda _ {0}} \ venstre [\ Delta (\ lambda _ {0} \ parallel p _ {\ rm {CNML}}) \ right] & = \ psi (n)+{\ frac {1} {n}}-\ log (n) \ end {align}}}

hvor forventningen tages med hensyn til den eksponentielle fordeling med hastighedsparameter λ ₀ ∈ (0, ∞) , og ψ (·) er digamma -funktionen. Det er klart, at CNML-forudsigelsesfordelingen er strengt bedre end den maksimale sandsynligheds-plug-in-distribution med hensyn til gennemsnitlig Kullback – Leibler-divergens for alle stikprøvestørrelser n > 0 .

Beregningsmetoder

Generering af eksponentielle varianter

En konceptuelt meget enkel metode til generering af eksponentielle varianter er baseret på invers transform sampling : I betragtning af en tilfældig variant U trukket fra den ensartede fordeling på enhedsintervallet $(0, 1)$ , er varianten

{\ displaystyle T = F^{-1} (U)}

har en eksponentiel fordeling, hvor F ⁻¹ er den kvantile funktion , defineret af

{\ displaystyle F^{-1} (p) = {\ frac {-\ ln (1-p)} {\ lambda}}.}

Desuden, hvis U er ensartet på (0, 1), så er 1 - U også . Dette betyder, at man kan generere eksponentielle varianter som følger:

{\ displaystyle T = {\ frac {-\ ln (U)} {\ lambda}}.}

Andre metoder til generering af eksponentielle varianter diskuteres af Knuth og Devroye.

En hurtig metode til at generere et sæt færdigbestilte eksponentielle varianter uden at bruge en sorteringsrutine er også tilgængelig.

Se også

Dead time - en anvendelse af eksponentiel distribution til partikeldetektoranalyse.
Laplace distribution , eller "dobbelt eksponentiel distribution".
Forhold mellem sandsynlighedsfordelinger
Marshall – Olkin eksponentiel distribution

Referencer

eksterne links

"Eksponentiel fordeling" , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
Online lommeregner for eksponentiel distribution

Languages

In other projects

Eksponentiel distribution - Exponential distribution

Indhold

Definitioner

Sandsynlighedstæthedsfunktion

Kumulativ fordelingsfunktion

Alternativ parametrering

Ejendomme

Gennemsnit, varians, øjeblikke og median

Hukommelsesløshed

Quantiles

Kullback – Leibler divergens

Maksimal entropifordeling

Fordeling af minimum af eksponentielle tilfældige variabler

Fælles øjeblikke med eksponentiel ordrestatistik

Summen af to uafhængige eksponentielle tilfældige variabler

Relaterede distributioner

Statistisk slutning

Parameterestimering

Omtrentlig minimizer af forventet kvadratfejl

Fisher oplysninger

Tillidsintervaller

Bayesisk slutning

Forekomst og applikationer

Forekomst af begivenheder

Forudsigelse

Beregningsmetoder

Generering af eksponentielle varianter

Se også

Referencer

eksterne links

Languages

In other projects

Eksponentiel distribution - Exponential distribution

Definitioner

Sandsynlighedstæthedsfunktion

Kumulativ fordelingsfunktion

Alternativ parametrering

Ejendomme

Gennemsnit, varians, øjeblikke og median

Hukommelsesløshed

Quantiles

Kullback – Leibler divergens

Maksimal entropifordeling

Fordeling af minimum af eksponentielle tilfældige variabler

Fælles øjeblikke med eksponentiel ordrestatistik

Summen af ​​to uafhængige eksponentielle tilfældige variabler

Relaterede distributioner

Statistisk slutning

Parameterestimering

Omtrentlig minimizer af forventet kvadratfejl

Fisher oplysninger

Tillidsintervaller

Bayesisk slutning

Forekomst og applikationer

Forekomst af begivenheder

Forudsigelse

Beregningsmetoder

Generering af eksponentielle varianter

Se også

Referencer

eksterne links

Summen af to uafhængige eksponentielle tilfældige variabler