Bit
Bitten er den grundlæggende informationsenhed inden for datalogi og digital kommunikation. Navnet er et makedonsk ord af de engelske termer " binary " (binær) og "digi t " (cifret) [1] . Det har to forskellige betydninger, afhængigt af den sammenhæng, det bruges i:
- i datalogi er det et binært ciffer, det vil sige et af de to symboler i det binære talsystem , klassisk kaldet nul (0) og et (1); vi kan tale om et antal på 8, 16, 32 ... bit, da vi i den fælles basis ti taler om et antal på 8, 16, 32 ... cifre.
- i informationsteori er det måleenheden defineret som den mindste mængde information , der tjener til at skelne mellem to ligesandsynlige hændelser.
Forskellen mellem de to betydninger kan opsummeres med en sætning som " modtagelsen af de sidste 100 meddelelsesbit har øget vores information med 40 bit ".
Som mængde af information
I denne sammenhæng repræsenterer en bit måleenheden for mængden af information.
Dette bitbegreb blev introduceret af Claude Shannons informationsteori i 1948 og bruges inden for datakomprimering og digitale transmissioner.
Det svarer intuitivt til at vælge mellem to værdier (ja/nej, sand/falsk, til/fra), når disse har samme sandsynlighed for at blive valgt. Generelt for begivenheder, der ikke nødvendigvis er lige sandsynlige, repræsenterer mængden af information om en begivenhed "overraskelsen" ved at fastslå forekomsten af en sådan begivenhed; for eksempel, hvis en begivenhed er sikker, overrasker dens forekomst ikke nogen, derfor er dens informationsindhold nul; hvis en begivenhed på den anden side er sjælden, er dens forekomst overraskende, derfor er dens informationsindhold højt.
Matematisk er mængden af information i bits af en hændelse det modsatte af basis to-logaritmen af sandsynligheden for den hændelse. Valget af tallet 2 som basis for logaritmen er særligt væsentligt i det elementære tilfælde med at vælge mellem to alternativer (én-bit information), men det er også muligt at bruge ( Napiers tal ), og dermed bruge den naturlige logaritme; i dette tilfælde kaldes informationens måleenhed " Nat ".
I tilfælde af to ligesandsynlige hændelser har hver sandsynlighed 0,5, og derfor er deres informationsmængde −log 2 (0,5) = 1 bit.
Hvis en begivenhed er umulig, er sandsynligheden nul, dvs. dens mængde af information er uendelig.
Hvis en hændelse er sikker, er dens sandsynlighed én, og mængden af information er −log 2 (1) = 0 bit.
Hvis der er to mulige hændelser, den ene med sandsynlighed 25 % og den anden med sandsynlighed 75 %, formidler forekomsten af den første hændelse informationen −log 2 (0,25) = 2 bit, mens forekomsten af den anden hændelse overfører informationen af −log 2 (0,75) = ~ 0,415 bit.
Informationsindholdet (eller entropien ) af en hændelsesgenerator (kaldet "kilde") er det statistiske gennemsnit af informationsindholdet for hver mulig værdi, eller summen af informationen vægtet med sandsynligheden for den tilsvarende værdi.
I tilfælde af de to værdier med sandsynlighed 25% og 75% er informationsindholdet i kilden:
0,25 × −log 2 (0,25) + 0,75 × −log 2 (0,75) = ~ 0,811 bit.
Det vil sige, at kilden genererer mindre end én bit for hver hændelse.
I tilfælde af to lige sandsynlige hændelser har vi:
0,5 × −log 2 (0,5) + 0,5 × −log 2 (0,5) = 0,5 × 1 + 0,5 × 1 = 1 bit.
Det vil sige, at kilden genererer præcis én bit for hver begivenhed.
Som et binært ciffer
I denne sammenhæng repræsenterer biten definitionsenheden for en logisk tilstand, også defineret som den elementære informationsenhed, der behandles af en computer . Den logiske repræsentation af biten er kun repræsenteret af værdierne { 0 , 1 }. Til programmeringsformål er det almindeligt at gruppere sekvenser af bit i større enheder, der kan tage værdier i meget bredere intervaller end det, der tillades af en enkelt bit. Disse grupperinger indeholder generelt et antal binære strenge svarende til en binær potens , dvs. lig med 2 n ; den mest kendte er byten (også kaldet oktet), svarende til 8 bit, som er den mest udbredte måleenhed på IT -området . Andre grupperinger af denne type er følgende:
- nibble 4 bits, en halv byte
- ord med variabel længde , svarer til 16 eller 32 eller 64 bit afhængigt af maskinens type.
( Windows API definerer datatypen WORD som et usigneret 16-bit heltal på alle platforme. Denne omstændighed, kombineret med de normale krav til bagudkompatibilitet i nye systemer, bevirker ofte, at længden af et ord bliver fastsat til 16-bit uanset hardware .)
- dobbeltord lig med 2 ord ( DWORDo LONGWORD)
- quad-ord lig med 4 ord ( QWORD)
- kibibyte 1024 bytes, betegnet med KiB
- mebibyte 1024 kibibyte, betegnet med MiB
- gibibyte 1024 mebibyte, betegnet med GiB
- tebibyte 1024 gibibyte, betegnet med TiB
- pebibyte 1024 tebibyte, betegnet med PiB
- exbibyte 1024 pebibyte, angivet med EiB
- zebibyte 1024 exbibyte, angivet med ZiB
- yobibyte 1024 zebibyte, betegnet med YiB
NB: Udtrykkene word , double word og quad word bruges som datatype i programmering (hovedsageligt i assemblersprog og i C-sprog ).
Noter
- ^ Charles E. Mackenzie, Kodede tegnsæt: Historie og udvikling , Addison-Wesley Publishing Company, 1980, ISBN 978-0-201-14460-4 . Hentet 27. april 2022 .
Relaterede emner
Andre projekter
Wiktionary indeholder ordbogslemmaet " bit "
Eksterne links
- bit , på Treccani.it - Online Encyclopedias , Institute of the Italian Encyclopedia .
- ( EN ) Bit , i Encyclopedia Britannica , Encyclopædia Britannica, Inc.