Betinget entropi - Conditional entropy

Image
Venn -diagram, der viser additive og subtraktive relationer forskellige informationsmålinger forbundet med korrelerede variabler og . Området indeholdt i begge cirkler er den fælles entropi . Cirklen til venstre (rød og violet) er den individuelle entropi , hvor den røde er den betingede entropi . Cirklen til højre (blå og violet) er med det blå væsen . Den violette er den gensidige information .

I informationsteorien kvantificerer den betingede entropi mængden af ​​information, der er nødvendig for at beskrive resultatet af en tilfældig variabel, da værdien af ​​en anden tilfældig variabel er kendt. Her måles oplysninger i shannons , nats eller hartleys . Den entropi under forudsætning af, er skrevet som .

Definition

Den givne betingede entropi er defineret som

 

 

 

 

( Ligning 1 )

hvor og betegne støttesæt af og .

Bemærk: Det er konventionelt, at udtrykkene og for faste skal behandles som værende lig med nul. Det er fordi og

Intuitiv forklaring af definitionen: Ifølge definitionen, hvor associerer sig til det givne informationsindhold , hvilket er mængden af ​​information, der er nødvendig for at beskrive den givne begivenhed . Ifølge loven om store tal er det aritmetiske middel for et stort antal uafhængige erkendelser af .

Motivering

Lad være entropien for den diskrete tilfældige variabel betinget af, at den diskrete tilfældige variabel tager en bestemt værdi . Betegn støttesættene til og ved og . Lad have sandsynlighedsmassafunktion . Den ubetingede entropi af beregnes som , dvs.

hvor er informationsindholdet i resultatet af at tage værdien . Entropien med betinget af at tage værdien defineres analogt af betinget forventning :

Bemærk, at det er resultatet af et gennemsnit af alle mulige værdier, der kan tage. Hvis ovenstående sum overtages i en prøve , er den forventede værdi også kendt i nogle domæner som tvetydighed .

Givne diskrete stokastiske variable med billede og med billedet , den betingede entropi given størrelse er defineret som den vægtede sum af for hver mulig værdi af under anvendelse som vægtene:


Ejendomme

Betinget entropi er lig med nul

hvis og kun hvis værdien af er fuldstændig bestemt af værdien af .

Betinget entropi af uafhængige tilfældige variabler

Omvendt, hvis og kun hvis og er uafhængige tilfældige variabler .

Kæderegel

Antag, at det kombinerede system bestemt af to tilfældige variabler og har fælles entropi , det vil sige, at vi i gennemsnit har brug for informationsstykker for at beskrive dets nøjagtige tilstand. Hvis vi først lærer værdien af , har vi fået informationer. Når det først er kendt, behøver vi kun bits for at beskrive hele systemets tilstand. Denne mængde er præcis , hvilket giver kædereglen for betinget entropi:

Kædereglen følger af ovenstående definition af betinget entropi:

Generelt gælder en kæderegel for flere tilfældige variabler:

Det har en lignende form som kæderegel i sandsynlighedsteorien, bortset fra at addition i stedet for multiplikation bruges.

Bayes 'regel

Bayes 'regel for betingede entropistater

Bevis. og . Symmetri medfører . Subtraktion af de to ligninger indebærer Bayes 'regel.

Hvis er betinget uafhængig af givet har vi:

Andre ejendomme

For enhver og :

hvor er den gensidige information mellem og .

Til uafhængige og :

og

Selvom den specifikt betingede entropi enten kan være mindre eller større end for en given tilfældig variant af , kan den aldrig overstige .

Betinget differential entropi

Definition

Ovenstående definition er for diskrete tilfældige variabler. Den kontinuerlige version af diskret betinget entropi kaldes betinget differential (eller kontinuerlig) entropi . Lad og vær en kontinuerlig tilfældig variabel med en fælles sandsynlighedstæthedsfunktion . Den differentielle betingede entropi defineres som

 

 

 

 

( Ligning 2 )

Ejendomme

I modsætning til den betingede entropi for diskrete tilfældige variabler kan den betingede differentielle entropi være negativ.

Som i den diskrete sag er der en kæderegel for differentiel entropi:

Bemærk dog, at denne regel muligvis ikke er sand, hvis de involverede differentielle entropier ikke eksisterer eller er uendelige.

Fælles differential entropi bruges også i definitionen af ​​den gensidige information mellem kontinuerlige tilfældige variabler:

med lighed, hvis og kun hvis og er uafhængige.

Forhold til estimatorfejl

Den betingede differentielle entropi giver en nedre grænse for en estimators forventede kvadrerede fejl . For enhver tilfældig variabel , observation og estimator gælder følgende:

Dette hænger sammen med usikkerhedsprincippet fra kvantemekanik .

Generalisering til kvanteteori

I kvanteinformationsteorien generaliseres den betingede entropi til den betingede kvanteentropi . Sidstnævnte kan tage negative værdier, i modsætning til dens klassiske modstykke.

Se også

Referencer