Maß für relative Informationen in der Wahrscheinlichkeitstheorie
In der Informationstheorie quantifiziert die bedingte Entropie die Informationsmenge, die benötigt wird, um das Ergebnis einer Zufallsvariablen zu beschreiben, vorausgesetzt , der Wert einer anderen Zufallsvariablen ist bekannt. Hier werden Informationen in Shannons , Nats oder Hartleys gemessen . Die Entropie von bedingt auf wird geschrieben als .





Definition
Die bedingte Entropie von Gegeben ist definiert als



|
|
( Gl.1 )
|
wobei und die Stützsätze von und bezeichnen .




Hinweis: Es ist üblich, dass die Ausdrücke und für fixed als gleich Null behandelt werden. Das liegt daran und



Intuitive Erklärung der Definition: Gemäß der Definition, wo mit dem Informationsgehalt von gegeben verbunden ist , ist dies die Menge an Informationen, die benötigt wird, um das gegebene Ereignis zu beschreiben . ist nach dem Gesetz der großen Zahlen das arithmetische Mittel einer großen Anzahl unabhängiger Realisierungen von .









Motivation
Sei die Entropie der diskreten Zufallsvariablen bedingt davon, dass die diskrete Zufallsvariable einen bestimmten Wert annimmt . Bezeichnen Sie die Stützsätze von und von und . Sei die Wahrscheinlichkeitsmassenfunktion . Die unbedingte Entropie von wird berechnet als , dh










![{\displaystyle \mathrm {H} (Y):=\mathbb {E} [\operatorname {I} (Y)]}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/f114631caeb95e508a74994486e35e972220b378)

wo ist der Informationsgehalt des Ergebnisses der den Wert nehmen . Die Entropie der bedingten Wertübernahme wird analog durch bedingten Erwartungswert definiert :







Beachten Sie, dass dies das Ergebnis der Mittelwertbildung über alle möglichen Werte ist , die möglicherweise angenommen werden. Auch wenn die obige Summe über eine Stichprobe gezogen wird , wird der erwartete Wert in einigen Domänen als Äquivokation bezeichnet .





![{\displaystyle E_{X}[\mathrm {H} (y_{1},\dots,y_{n}\mid X=x)]}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/c42f84b74f174cb4c172b6f91074f65dbd915e40)
Gegebenen diskreten Zufallsvariablen mit image und mit image wird die bedingte Entropie von gegeben als gewichtete Summe von für jeden möglichen Wert von definiert , wobei als Gewichte verwendet werden:










Eigenschaften
Bedingte Entropie gleich Null
genau dann, wenn der Wert von vollständig durch den Wert von bestimmt wird .


Bedingte Entropie unabhängiger Zufallsvariablen
Umgekehrt genau dann, wenn und sind unabhängige Zufallsvariablen .



Kettenregel
Angenommen, das kombinierte System wird durch zwei Zufallsvariablen bestimmt und hat eine gemeinsame Entropie , d . Wenn wir jetzt zuerst den Wert von erfahren , haben wir einige Informationen gewonnen. Sobald bekannt ist, benötigen wir nur noch Bits, um den Zustand des gesamten Systems zu beschreiben. Diese Größe ist genau , was die Kettenregel der bedingten Entropie ergibt :









Aus der obigen Definition der bedingten Entropie folgt die Kettenregel:
![{\displaystyle {\begin{ausgerichtet}\mathrm {H} (Y|X)&=\sum _{x\in {\mathcal {X}},y\in {\mathcal {Y}}}p(x ,y)\log \left({\frac {p(x)}{p(x,y)}}\right)\\[4pt]&=\sum _{x\in {\mathcal {X}} ,y\in {\mathcal{Y}}}p(x,y)(\log(p(x))-\log(p(x,y)))\\[4pt]&=-\sum _ {x\in {\mathcal{X}},y\in {\mathcal{Y}}}p(x,y)\log(p(x,y))+\sum _{x\in {\mathcal {X}},y\in {\mathcal{Y}}}{p(x,y)\log(p(x))}\\[4pt]&=\mathrm {H} (X,Y)+ \sum_{x\in{\mathcal{X}}}p(x)\log(p(x))\\[4pt]&=\mathrm {H} (X,Y)-\mathrm {H} (X).\end{ausgerichtet}}}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/501bd3a915d2218c4464e1ea8cfefc3fba872320)
Im Allgemeinen gilt eine Kettenregel für mehrere Zufallsvariablen:

Sie hat eine ähnliche Form wie die Kettenregel in der Wahrscheinlichkeitstheorie, außer dass Addition statt Multiplikation verwendet wird.
Bayes' Regel
Bayessche Regel für bedingte Entropiezustände

Nachweisen. und . Symmetrie bedeutet . Die Subtraktion der beiden Gleichungen impliziert die Bayes-Regel.



Wenn ist bedingt unabhängig von bestimmten wir haben:




Andere Eigenschaften
Für alle und :



wo ist die gegenseitige information zwischen und .



Für Selbständige und :


-
und
Obwohl die spezifisch-bedingte Entropie entweder kleiner oder größer als für eine gegebene Zufallsvariable von sein kann , kann sie niemals überschreiten .





Bedingte differentielle Entropie
Definition
Die obige Definition gilt für diskrete Zufallsvariablen. Die kontinuierliche Version der diskreten bedingten Entropie wird als bedingte differentielle (oder kontinuierliche) Entropie bezeichnet . Seien und eine stetige Zufallsvariable mit einer gemeinsamen Wahrscheinlichkeitsdichtefunktion . Die differentielle bedingte Entropie ist definiert als




|
|
( Gl.2 )
|
Eigenschaften
Im Gegensatz zur bedingten Entropie für diskrete Zufallsvariablen kann die bedingte differentielle Entropie negativ sein.
Wie im diskreten Fall gilt für die differentielle Entropie eine Kettenregel:

Beachten Sie jedoch, dass diese Regel möglicherweise nicht zutrifft, wenn die beteiligten differentiellen Entropien nicht existieren oder unendlich sind.
Die gemeinsame differentielle Entropie wird auch bei der Definition der gegenseitigen Information zwischen stetigen Zufallsvariablen verwendet:

mit Gleichheit genau dann, wenn und unabhängig sind.


Beziehung zum Schätzerfehler
Die bedingte differentielle Entropie liefert eine untere Schranke für den erwarteten quadratischen Fehler eines Schätzers . Für jede Zufallsvariable , Beobachtung und Schätzer gilt:



Dies hängt mit der Unschärferelation aus der Quantenmechanik zusammen .
Verallgemeinerung auf die Quantentheorie
In der Quanteninformationstheorie wird die bedingte Entropie auf die bedingte Quantenentropie verallgemeinert . Letzteres kann im Gegensatz zu seinem klassischen Gegenstück negative Werte annehmen.
Siehe auch
Verweise