Miara informacji względnej w teorii prawdopodobieństwa
W teorii informacji , entropia warunkowa wylicza ilość informacji potrzebnej do opisania wynik w zmiennej losowej danej że wartość innej zmiennej losowej jest znana. Tutaj informacje są mierzone w shannonach , nats lub hartleyach . Entropia uwarunkowane jest napisane jak .





Definicja
Entropia warunkowa danego jest zdefiniowana jako



|
|
( Równanie 1 )
|
gdzie i oznaczają zestawów wsparcia z i .




Uwaga: Przyjęło się, że wyrażenia i for fixed powinny być traktowane jako równe zero. To dlatego, że i



Intuicyjne wyjaśnienie definicji: Zgodnie z definicją, gdzie Associates zawartości informacyjnej podane potrzebne, czyli ilość informacji, aby opisać zdarzenie podane . Zgodnie z prawem wielkich liczb jest średnią arytmetyczną dużej liczby niezależnych realizacji .









Motywacja
Niech będzie entropia dyskretnej zmiennej losowej uwarunkowana przyjęciem przez dyskretną zmienną losową określonej wartości . Oznacz zestawy podpór oraz przy i . Pozwolić mieć funkcja masy prawdopodobieństwa . Bezwarunkowa entropia jest obliczana jako , tj










![{\ Displaystyle \ operatorname {H} (Y): = \ mathbb {E} [\ Operator {I} (Y)]}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/f114631caeb95e508a74994486e35e972220b378)

gdzie jest treść informacji o wynikach z przyjmując wartość . Entropia warunkowego przyjęcia wartości jest zdefiniowana analogicznie przez warunkowe oczekiwanie :







Zauważ, że jest to wynik uśredniania wszystkich możliwych wartości, które mogą przyjąć. Ponadto, jeśli powyższa suma zostanie przejęta przez próbkę , wartość oczekiwana jest znana w niektórych dziedzinach jako ekwiwokacja .





![{\ Displaystyle E_ {X} [\ operatorname {H} (y_ {1}, \ kropki, y_ {n} \ mid X = x)]}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/c42f84b74f174cb4c172b6f91074f65dbd915e40)
Biorąc pod uwagę dyskretne zmienne losowe z obrazem i z obrazem , warunkową entropię danej definiuje się jako ważoną sumę dla każdej możliwej wartości , stosując jako wagi:










Nieruchomości
Entropia warunkowa równa się zero
wtedy i tylko wtedy, gdy wartość jest całkowicie określona przez wartość .


Entropia warunkowa niezależnych zmiennych losowych
I odwrotnie, wtedy i tylko wtedy, gdy i są niezależnymi zmiennymi losowymi .



Zasada łańcuchowa
Załóżmy, że układ złożony określony przez dwie zmienne losowe i ma łączną entropię , czyli potrzebujemy średnio bitów informacji, aby opisać jego dokładny stan. Teraz, jeśli najpierw poznamy wartość , zdobyliśmy trochę informacji. Kiedy już wiemy, potrzebujemy tylko bitów do opisania stanu całego systemu. Ta wielkość to dokładnie , co daje regułę łańcucha warunkowej entropii:









Zasada łańcucha wynika z powyższej definicji entropii warunkowej:
![{\ Displaystyle {\ zacząć {wyrównany} \ operatorname {H} (Y | X) i = \ suma _ {x \ w {\ mathcal {X}}, y \ w {\ mathcal {Y}}} p (x ,y)\log \left({\frac {p(x)}{p(x,y)}}\right)\\[4pt]&=\sum _{x\in {\mathcal {X}} ,y\in {\mathcal {Y}}}p(x,y)(\log(p(x))-\log(p(x,y)))\\[4pt]&=-\sum _ {x\in {\mathcal {X}},y\in {\mathcal {Y}}}p(x,y)\log(p(x,y))+\sum _{x\in {\mathcal {X}},y\in {\mathcal {Y}}}{p(x,y)\log(p(x))}\\[4pt]&=\mathrm {H} (X,Y)+ \sum _{x\in {\mathcal {X}}}p(x)\log(p(x))\\[4pt]&=\mathrm {H} (X,Y)-\mathrm {H} (X).\end{wyrównany}}}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/501bd3a915d2218c4464e1ea8cfefc3fba872320)
Ogólnie obowiązuje reguła łańcucha dla wielu zmiennych losowych:

Ma podobną formę do reguły łańcuchowej w teorii prawdopodobieństwa, z tą różnicą, że stosuje się dodawanie zamiast mnożenia.
Zasada Bayesa
Reguła Bayesa dla stanów warunkowej entropii

Dowód. i . Symetria pociąga za sobą . Odjęcie dwóch równań implikuje regułę Bayesa.



Jeżeli jest warunkowo niezależna od podanego mamy:




Inne właściwości
Dla każdego i :



gdzie są wzajemne informacje między i .



Dla niezależnych i :


-
oraz
Choć specyficzne-entropia warunkowa może być mniejszy lub większy niż dla danego losowej variate dnia , nigdy nie można przekroczyć .





Warunkowa entropia różniczkowa
Definicja
Powyższa definicja dotyczy dyskretnych zmiennych losowych. Ciągła wersja dyskretnej entropii warunkowej nazywana jest warunkową entropią różniczkową (lub ciągłą) . Niech i będą ciągłymi zmiennymi losowymi z łączną funkcją gęstości prawdopodobieństwa . Różnicowa entropia warunkowa jest zdefiniowana jako




|
|
( Równanie 2 )
|
Nieruchomości
W przeciwieństwie do entropii warunkowej dla dyskretnych zmiennych losowych, warunkowa entropia różnicowa może być ujemna.
Podobnie jak w przypadku dyskretnym, obowiązuje łańcuchowa reguła entropii różniczkowej:

Zauważ jednak, że ta zasada może nie być prawdziwa, jeśli zaangażowane entropie różniczkowe nie istnieją lub są nieskończone.
Łączna entropia różniczkowa jest również używana w definicji wzajemnej informacji między ciągłymi zmiennymi losowymi:

z równością wtedy i tylko wtedy, gdy i są niezależne.


Związek z błędem estymatora
Warunkowa entropia różniczkowa daje dolną granicę oczekiwanego kwadratowego błędu estymatora . Dla dowolnej zmiennej losowej , obserwacji i estymatora obowiązuje:



Wiąże się to z zasadą nieoznaczoności z mechaniki kwantowej .
Uogólnienie na teorię kwantową
W teorii informacji kwantowej warunkowa entropia jest uogólniana na warunkową entropię kwantową . Ten ostatni może przyjmować wartości ujemne, w przeciwieństwie do swojego klasycznego odpowiednika.
Zobacz też
Bibliografia