close

Bit

Hop til navigation Hop til søgning

Bitten er den grundlæggende informationsenhed inden for datalogi og digital kommunikation. Navnet er et makedonsk ord af de engelske termer " binary " (binær) og "digi t " (cifret) [1] . Det har to forskellige betydninger, afhængigt af den sammenhæng, det bruges i:

  • i datalogi er det et binært ciffer, det vil sige et af de to symboler i det binære talsystem , klassisk kaldet nul (0) og et (1); vi kan tale om et antal på 8, 16, 32 ... bit, da vi i den fælles basis ti taler om et antal på 8, 16, 32 ... cifre.
  • i informationsteori er det måleenheden defineret som den mindste mængde information , der tjener til at skelne mellem to ligesandsynlige hændelser.

Forskellen mellem de to betydninger kan opsummeres med en sætning som " modtagelsen af ​​de sidste 100 meddelelsesbit har øget vores information med 40 bit ".

Som mængde af information

I denne sammenhæng repræsenterer en bit måleenheden for mængden af ​​information.

Dette bitbegreb blev introduceret af Claude Shannons informationsteori i 1948 og bruges inden for datakomprimering og digitale transmissioner.

Det svarer intuitivt til at vælge mellem to værdier (ja/nej, sand/falsk, til/fra), når disse har samme sandsynlighed for at blive valgt. Generelt for begivenheder, der ikke nødvendigvis er lige sandsynlige, repræsenterer mængden af ​​information om en begivenhed "overraskelsen" ved at fastslå forekomsten af ​​en sådan begivenhed; for eksempel, hvis en begivenhed er sikker, overrasker dens forekomst ikke nogen, derfor er dens informationsindhold nul; hvis en begivenhed på den anden side er sjælden, er dens forekomst overraskende, derfor er dens informationsindhold højt.

Matematisk er mængden af ​​information i bits af en hændelse det modsatte af basis to-logaritmen af ​​sandsynligheden for den hændelse. Valget af tallet 2 som basis for logaritmen er særligt væsentligt i det elementære tilfælde med at vælge mellem to alternativer (én-bit information), men det er også muligt at bruge ( Napiers tal ), og dermed bruge den naturlige logaritme; i dette tilfælde kaldes informationens måleenhed " Nat ".

I tilfælde af to ligesandsynlige hændelser har hver sandsynlighed 0,5, og derfor er deres informationsmængde −log 2 (0,5) = 1 bit.

Hvis en begivenhed er umulig, er sandsynligheden nul, dvs. dens mængde af information er uendelig.

Hvis en hændelse er sikker, er dens sandsynlighed én, og mængden af ​​information er −log 2 (1) = 0 bit.

Hvis der er to mulige hændelser, den ene med sandsynlighed 25 % og den anden med sandsynlighed 75 %, formidler forekomsten af ​​den første hændelse informationen −log 2 (0,25) = 2 bit, mens forekomsten af ​​den anden hændelse overfører informationen af −log 2 (0,75) = ~ 0,415 bit.

Informationsindholdet (eller entropien ) af en hændelsesgenerator (kaldet "kilde") er det statistiske gennemsnit af informationsindholdet for hver mulig værdi, eller summen af ​​informationen vægtet med sandsynligheden for den tilsvarende værdi.

I tilfælde af de to værdier med sandsynlighed 25% og 75% er informationsindholdet i kilden:

0,25 × −log 2 (0,25) + 0,75 × −log 2 (0,75) = ~ 0,811 bit.

Det vil sige, at kilden genererer mindre end én bit for hver hændelse.

I tilfælde af to lige sandsynlige hændelser har vi:

0,5 × −log 2 (0,5) + 0,5 × −log 2 (0,5) = 0,5 × 1 + 0,5 × 1 = 1 bit.

Det vil sige, at kilden genererer præcis én bit for hver begivenhed.

Som et binært ciffer

I denne sammenhæng repræsenterer biten definitionsenheden for en logisk tilstand, også defineret som den elementære informationsenhed, der behandles af en computer . Den logiske repræsentation af biten er kun repræsenteret af værdierne { 0 , 1 }. Til programmeringsformål er det almindeligt at gruppere sekvenser af bit i større enheder, der kan tage værdier i meget bredere intervaller end det, der tillades af en enkelt bit. Disse grupperinger indeholder generelt et antal binære strenge svarende til en binær potens , dvs. lig med 2 n ; den mest kendte er byten (også kaldet oktet), svarende til 8 bit, som er den mest udbredte måleenhed på IT -området . Andre grupperinger af denne type er følgende:

  • nibble 4 bits, en halv byte
  • ord med variabel længde , svarer til 16 eller 32 eller 64 bit afhængigt af maskinens type.

( Windows API definerer datatypen WORD som et usigneret 16-bit heltal på alle platforme. Denne omstændighed, kombineret med de normale krav til bagudkompatibilitet i nye systemer, bevirker ofte, at længden af ​​et ord bliver fastsat til 16-bit uanset hardware .)

NB: Udtrykkene word , double word og quad word bruges som datatype i programmering (hovedsageligt i assemblersprog og i C-sprog ).

Noter

  1. ^ Charles E. Mackenzie, Kodede tegnsæt: Historie og udvikling , Addison-Wesley Publishing Company, 1980, ISBN 978-0-201-14460-4 . Hentet 27. april 2022 . 

Relaterede emner

Andre projekter

Eksterne links