Măsurarea informațiilor relative în teoria probabilităților
În teoria informației , entropia condițională cuantifică cantitatea de informații necesare pentru a descrie rezultatul unei variabile aleatorii, având în vedere că valoarea unei alte variabile aleatoare este cunoscută. Aici, informațiile se măsoară în Shannons , TAN , sau hartleys . Entropia condiționată este scris ca .





Definiție
Entropia condiționată a GIVEN este definită ca



|
|
( Ec. 1 )
|
unde și denotă seturile de suport ale și .




Notă: Este convențional ca expresiile și pentru fix să fie tratate ca fiind egale cu zero. Acest lucru se datorează faptului că și



Explicație intuitivă a definiției: Conform definiției, în cazul în care asociază conținutul informațional al date , care este cantitatea de informații necesare pentru a descrie evenimentul dat . Conform legii numerelor mari, este media aritmetică a unui număr mare de realizări independente ale .









Motivație
Să fie entropia variabilei aleatoare discrete condiționată variabila aleatoare discretă de a lua o anumită valoare . Indicați seturile de suport ale și de și . Să aibă funcția de masă de probabilitate . Entropia necondiționată a este calculată ca , adică










![{\ displaystyle \ mathrm {H} (Y): = \ mathbb {E} [\ operatorname {I} (Y)]}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/f114631caeb95e508a74994486e35e972220b378)

în cazul în care este conținutul de informații al rezultatului de a lua valoarea . Entropia condiționată de luarea valorii este definită în mod analog de așteptarea condiționată :







Rețineți că este rezultatul medierii asupra tuturor valorilor posibile care pot fi luate. De asemenea, dacă suma de mai sus este preluată asupra unui eșantion , valoarea așteptată este cunoscută în unele domenii ca echivocare .





![{\ displaystyle E_ {X} [\ mathrm {H} (y_ {1}, \ dots, y_ {n} \ mid X = x)]}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/c42f84b74f174cb4c172b6f91074f65dbd915e40)
Avand in vedere variabile aleatoare discrete cu imagini și cu imagine , entropia condiționată a GIVEN este definită ca suma ponderată a pentru fiecare valoare posibilă a , folosind ca ponderilor:










Proprietăți
Entropia condițională este egală cu zero
dacă și numai dacă valoarea lui este complet determinată de valoarea lui .


Entropia condiționată a variabilelor aleatoare independente
În schimb, dacă și numai dacă și sunt variabile aleatoare independente .



Regula lanțului
Să presupunem că sistemul combinat determinat de două variabile aleatorii și are entropie comună , adică avem nevoie de biți de informații în medie pentru a descrie starea exactă a acestuia. Acum, dacă învățăm prima dată valoarea , am câștigat informații. Odată cunoscut, avem nevoie doar de biți pentru a descrie starea întregului sistem. Această cantitate este exact , ceea ce dă regula lanțului entropiei condiționate:









Regula lanțului rezultă din definiția de mai sus a entropiei condiționate:
![{\ displaystyle {\ begin {align} \ mathrm {H} (Y | X) & = \ sum _ {x \ in {\ mathcal {X}}, y \ in {\ mathcal {Y}}} p (x , y) \ log \ left ({\ frac {p (x)} {p (x, y)}} \ right) \\ [4pt] & = \ sum _ {x \ in {\ mathcal {X}} , y \ in {\ mathcal {Y}}} p (x, y) (\ log (p (x)) - \ log (p (x, y))) \\ [4pt] & = - \ sum _ {x \ in {\ mathcal {X}}, y \ in {\ mathcal {Y}}} p (x, y) \ log (p (x, y)) + \ sum _ {x \ in {\ mathcal {X}}, y \ in {\ mathcal {Y}}} {p (x, y) \ log (p (x))} \\ [4pt] & = \ mathrm {H} (X, Y) + \ sum _ {x \ in {\ mathcal {X}}} p (x) \ log (p (x)) \\ [4pt] & = \ mathrm {H} (X, Y) - \ mathrm {H} (X). \ End {align}}}](/criselda-https-wikimedia.org/api/rest_v1/media/math/render/svg/501bd3a915d2218c4464e1ea8cfefc3fba872320)
În general, o regulă de lanț pentru mai multe variabile aleatoare conține:

Are o formă similară cu regula lanțului în teoria probabilității, cu excepția faptului că se folosește adunarea în loc de multiplicare.
Regula lui Bayes
Regula lui Bayes pentru stările de entropie condiționată

Dovadă. și . Simetria presupune . Scăderea celor două ecuații implică regula lui Bayes.



Dacă este condiționat independent de dat, avem:




Alte proprietăți
Pentru orice și :



unde este informația reciprocă între și .



Pentru independent și :


-
și
Deși entropia specific-condițională poate fi mai mică sau mai mare decât pentru o anumită variabilă aleatorie a , nu poate depăși niciodată .





Entropie diferențială condiționată
Definiție
Definiția de mai sus este pentru variabile aleatorii discrete. Versiunea continuă a entropiei condiționale discrete se numește entropie condițională diferențială (sau continuă) . Fie și să fie o variabilă continuă aleatorie cu o funcție de densitate a probabilității comune . Entropia condițională diferențială este definită ca




|
|
( Ec. 2 )
|
Proprietăți
Spre deosebire de entropia condițională pentru variabilele aleatorii discrete, entropia diferențială condițională poate fi negativă.
Ca și în cazul discret, există o regulă de lanț pentru entropia diferențială:

Observați totuși că această regulă poate să nu fie adevărată dacă entropiile diferențiale implicate nu există sau sunt infinite.
Entropia diferențială comună este, de asemenea, utilizată în definirea informațiilor reciproce între variabilele aleatoare continue:

cu egalitate dacă și numai dacă și sunt independenți.


Relația cu eroarea estimatorului
Entropia diferențială condițională produce o limită inferioară a erorii pătrate așteptate a unui estimator . Pentru orice variabilă aleatorie , observare și estimator, se aplică următoarele:



Acest lucru este legat de principiul incertitudinii din mecanica cuantică .
Generalizarea la teoria cuantică
În teoria informației cuantice , entropia condițională este generalizată la entropia cuantică condițională . Acesta din urmă poate lua valori negative, spre deosebire de omologul său clasic.
Vezi si
Referințe