Måling af relativ information i sandsynlighedsteori
I informationsteorien kvantificerer den betingede entropi mængden af information, der er nødvendig for at beskrive resultatet af en tilfældig variabel, da værdien af en anden tilfældig variabel er kendt. Her måles oplysninger i shannons , nats eller hartleys . Den entropi under forudsætning af, er skrevet som .





Definition
Den givne betingede entropi er defineret som



|
|
( Ligning 1 )
|
hvor og betegne støttesæt af og .




Bemærk: Det er konventionelt, at udtrykkene og for faste skal behandles som værende lig med nul. Det er fordi og



Intuitiv forklaring af definitionen: Ifølge definitionen, hvor associerer sig til det givne informationsindhold , hvilket er mængden af information, der er nødvendig for at beskrive den givne begivenhed . Ifølge loven om store tal er det aritmetiske middel for et stort antal uafhængige erkendelser af .









Motivering
Lad være entropien for den diskrete tilfældige variabel betinget af, at den diskrete tilfældige variabel tager en bestemt værdi . Betegn støttesættene til og ved og . Lad have sandsynlighedsmassafunktion . Den ubetingede entropi af beregnes som , dvs.










![{\ displaystyle \ mathrm {H} (Y): = \ mathbb {E} [\ operatorname {I} (Y)]}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/f114631caeb95e508a74994486e35e972220b378)

hvor er informationsindholdet i resultatet af at tage værdien . Entropien med betinget af at tage værdien defineres analogt af betinget forventning :







Bemærk, at det er resultatet af et gennemsnit af alle mulige værdier, der kan tage. Hvis ovenstående sum overtages i en prøve , er den forventede værdi også kendt i nogle domæner som tvetydighed .





![{\ displaystyle E_ {X} [\ mathrm {H} (y_ {1}, \ dots, y_ {n} \ mid X = x)]}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/c42f84b74f174cb4c172b6f91074f65dbd915e40)
Givne diskrete stokastiske variable med billede og med billedet , den betingede entropi given størrelse er defineret som den vægtede sum af for hver mulig værdi af under anvendelse som vægtene:










Ejendomme
Betinget entropi er lig med nul
hvis og kun hvis værdien af er fuldstændig bestemt af værdien af .


Betinget entropi af uafhængige tilfældige variabler
Omvendt, hvis og kun hvis og er uafhængige tilfældige variabler .



Kæderegel
Antag, at det kombinerede system bestemt af to tilfældige variabler og har fælles entropi , det vil sige, at vi i gennemsnit har brug for informationsstykker for at beskrive dets nøjagtige tilstand. Hvis vi først lærer værdien af , har vi fået informationer. Når det først er kendt, behøver vi kun bits for at beskrive hele systemets tilstand. Denne mængde er præcis , hvilket giver kædereglen for betinget entropi:









Kædereglen følger af ovenstående definition af betinget entropi:
![{\ displaystyle {\ begin {align} \ mathrm {H} (Y | X) & = \ sum _ {x \ in {\ mathcal {X}}, y \ in {\ mathcal {Y}}} p (x , y) \ log \ left ({\ frac {p (x)} {p (x, y)}} \ right) \\ [4pt] & = \ sum _ {x \ in {\ mathcal {X}} , y \ i {\ mathcal {Y}}} p (x, y) (\ log (p (x))-\ log (p (x, y))) \\ [4pt] & =-\ sum _ {x \ in {\ mathcal {X}}, y \ in {\ mathcal {Y}}} p (x, y) \ log (p (x, y))+\ sum _ {x \ in {\ mathcal {X}}, y \ i {\ mathcal {Y}}} {p (x, y) \ log (p (x))} \\ [4pt] & = \ mathrm {H} (X, Y)+ \ sum _ {x \ i {\ mathcal {X}}} p (x) \ log (p (x)) \\ [4pt] & = \ mathrm {H} (X, Y)-\ mathrm {H} (X). \ End {align}}}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/501bd3a915d2218c4464e1ea8cfefc3fba872320)
Generelt gælder en kæderegel for flere tilfældige variabler:

Det har en lignende form som kæderegel i sandsynlighedsteorien, bortset fra at addition i stedet for multiplikation bruges.
Bayes 'regel
Bayes 'regel for betingede entropistater

Bevis. og . Symmetri medfører . Subtraktion af de to ligninger indebærer Bayes 'regel.



Hvis er betinget uafhængig af givet har vi:




Andre ejendomme
For enhver og :



hvor er den gensidige information mellem og .



Til uafhængige og :


-
og
Selvom den specifikt betingede entropi enten kan være mindre eller større end for en given tilfældig variant af , kan den aldrig overstige .





Betinget differential entropi
Definition
Ovenstående definition er for diskrete tilfældige variabler. Den kontinuerlige version af diskret betinget entropi kaldes betinget differential (eller kontinuerlig) entropi . Lad og vær en kontinuerlig tilfældig variabel med en fælles sandsynlighedstæthedsfunktion . Den differentielle betingede entropi defineres som




|
|
( Ligning 2 )
|
Ejendomme
I modsætning til den betingede entropi for diskrete tilfældige variabler kan den betingede differentielle entropi være negativ.
Som i den diskrete sag er der en kæderegel for differentiel entropi:

Bemærk dog, at denne regel muligvis ikke er sand, hvis de involverede differentielle entropier ikke eksisterer eller er uendelige.
Fælles differential entropi bruges også i definitionen af den gensidige information mellem kontinuerlige tilfældige variabler:

med lighed, hvis og kun hvis og er uafhængige.


Forhold til estimatorfejl
Den betingede differentielle entropi giver en nedre grænse for en estimators forventede kvadrerede fejl . For enhver tilfældig variabel , observation og estimator gælder følgende:



Dette hænger sammen med usikkerhedsprincippet fra kvantemekanik .
Generalisering til kvanteteori
I kvanteinformationsteorien generaliseres den betingede entropi til den betingede kvanteentropi . Sidstnævnte kan tage negative værdier, i modsætning til dens klassiske modstykke.
Se også
Referencer