Unicode -abonnemang och superscripts - Unicode subscripts and superscripts

Image
Skillnaden mellan superscript/subscript och teller/nämnare glyfer. I många populära teckensnitt är Unicode "superscript" och "subscript" tecken faktiskt täljare och nämnare glyfer.

Unicode har abonnemang och överskrift av ett antal tecken inklusive en hel uppsättning arabiska siffror . Dessa tecken gör att alla polynom , kemiska och vissa andra ekvationer kan representeras i klartext utan att använda någon form av markering som HTML eller TeX .

Den World Wide Web Consortium och Unicode Consortium har gjort rekommendationer om valet mellan att använda uppmärkning och använda upphöjda och nedsänkta tecken:

När det används i matematiskt sammanhang ( MathML ) rekommenderas det att konsekvent använda stilmarkering för överskrift och subskript .... Men när super- och subskript ska återspegla semantiska skillnader är det lättare att arbeta med dessa betydelser kodade i text snarare än markering, till exempel i fonetisk eller fonemisk transkription .

Användningsområden

Den avsedda användningen när dessa tecken lades till i Unicode var att tillåta kemiska formler och algebraformler och fonetik att skrivas utan markering, men producera sanna överskrift och abonnemang. Således "H ^ O" (med användning av en nedsänkt karaktär) är tänkt att vara identisk med "H 2 O" (med index markup).

I verkligheten ignorerar de flesta teckensnitt som innehåller dessa tecken Unicode -definitionen och utformar siffrorna för matematiska täljare och nämnare , som är mindre än normala tecken men är i linje med huvudlinjen respektive baslinjen . När de används med solidus är dessa glyfer användbara för att göra godtyckliga diagonala fraktioner (liknande ½ glyfen). Att göra fraktioner med hjälp av befintliga programvarusuper / abonnemang kräver många tecken och ser inte ut som den återgivna fraktionen (exempel: 1 / 2 ), så teckensnittsdesigners gav detta alternativ. Detta gör också de överskriftsbokstäverna användbara för ordinalindikatorer , vilket matchar characters- och º -tecknen närmare. Det gör dem emellertid felaktiga för vanliga super- och prenumerationer, och formler återges korrekt med hjälp av markering snarare än dessa tecken.

Unicode är avsett att producera diagonala fraktioner genom en annan mekanism men det stöds mycket dåligt. Den fraktion snedstreck U + 2044 är visuellt liknar solidus, men när den används med de vanliga siffrorna (inte de upphöjda och nedsänkt) är avsedd för att meddela en layoutsystem som en fraktion såsom ¾ skall visas med hjälp av automatisk glyf substitution för siffrorna . Vissa webbläsare stöder detta men inte i alla teckensnitt. Ett urval av teckensnitt visas i tabellen nedan.

Jämförelse av kodningar av enkla fraktioner
Tecken Font Resultat
U+00BD ½ VULGAR FRAKTION EN HALV Standard ½
U+00B9 ¹ SUPERSCRIPT ONE , U+002F / SOLIDUS , U+2082 SUBSCRIPT TWO ¹/₂
U+00B9 ¹ SUPERSCRIPT ONE , U+2044 FRACTION SLASH , U+2082 SUBSCRIPT TWO ¹⁄₂
U+0031 1 DIGIT ONE ,
U+2044 FRACTION SLASH ,
U+0032 2 DIGIT TWO
1⁄2
Arial 1⁄2
Cambria 1⁄2
Konsoler 1⁄2
Times New Roman 1⁄2
FiraGO 1⁄2
EB Garamond 1⁄2
Cantarell 1⁄2
Lato 1⁄2
Linux Libertine O 1⁄2
Nimbus Roman 1⁄2
Ubuntu 1⁄2
Yrsa 1⁄2

Överskrifter och prenumerationer blockerar

De vanligaste överskriftssiffrorna (1, 2 och 3) fanns i ISO-8859-1 och fördes därför över till dessa positioner i Latin-1-serien av Unicode. Resten placerades i en dedikerad del av Unicode vid U+ 2070 till U+ 209F. De två tabellerna nedan visar dessa tecken. Varje över- eller prenumerationstecken föregås av ett normalt x för att visa prenumerationen/överskriften. Tabellen till vänster innehåller de faktiska Unicode -tecknen; den till höger innehåller ekvivalenter som använder HTML -markering för abonnemanget eller superscriptet.

Unicode -tecken
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+00Bx
U+207x x⁰ xⁱ x⁴ x⁵ x⁶ x⁷ x⁸ x⁹ x⁺ x⁻ x⁼ x⁽ x⁾ xⁿ
U+208x x₀ x₁ x₂ x₃ x₄ x₅ x₆ x₇ x₈ x₉ x₊ x₋ x₌ x₍ x₎
U+209x xₐ xₑ xₒ xₓ xₔ xₕ xₖ xₗ xₘ xₙ xₚ xₛ xₜ
Simulerad användning <sup>eller <sub>taggar
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+00Bx x 2 x 3 x 1
U+207x x 0 x i x 4 x 5 x 6 x 7 x 8 x 9 x + x - x = x ( x ) x n
U+208x x 0 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x + x - x = x ( x )
U+209x x a x e x o x x x ə x h x k x l x m x n x s x s x t
  Reserverad för framtida bruk.
  Andra tecken från Latin-1 är inte relaterade till super- eller subskript.

Andra över- och underskriftstecken

Unicode version 13.0 innehåller också abonnemangs- och överskriftstecken som är avsedda för semantisk användning, i följande block:

Exponent
  • Den Latin-1 Supplement block innehåller det feminina och maskulina ordinal indikatorer ª och °.
  • Den latinska Extended-C- block innehåller en ytterligare superscript, ⱽ.
  • Det latinska Extended-D- blocket innehåller fem överskrift: ꝰ ꟸ ꟹ ꟲ ꟳ.
  • Det latinska Extended-E- blocket innehåller fem överskrift: ꭜ ꭝ ꭞ ꭟ ꭩ.
  • Det latinska Extended-F- blocket är helt och hållet superscript.
  • Den Mellanrum Modifier Letters blocket har upphöjda bokstäver och symboler som används för fonetisk transkription: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ .
  • Den fonetiska Extensions blocket har flera upphöjda bokstäver och symboler: Latin / IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, grekiska ᵝ ᵞ ᵟ ᵠ, kyrilliska ᵸ, andra ᵎ ᵔ ᵕ ᵙ ᵜ. Dessa är avsedda att indikera sekundär artikulation .
  • Den fonetiska Extensions Tillägg blocket har flera mer: Latin / IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ , grekiska ᶿ.
  • Det kyrilliska Extended-B- blocket innehåller två kyrilliska överskrift: ꚜ ꚝ.
  • Det georgiska blocket innehåller ett övertryckt Mkhedruli -brev : ჼ.
  • Den Kanbun blocket har upphöjd annotation tecken som används i japanska kopior av klassiska kinesiska texter: ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟ .
  • Den Tifinagh blocket har en upphöjd bokstav: ⵯ.
  • The Unified Canadian Aboriginal Syllabics och dess utökade block innehåller flera mestadels konsonant -bara bokstäver för att ange stavelse coda som kallas Finals, tillsammans med några tecken som anger stavelse medial känd som Medials: Huvudblock ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐣ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ᑉ ᑊ ᑋ ᒄ ᒄ ᒢ ᒻ ᒼ ᒽ ᒾ ᓑ ᓒ ᓪ ᓫ ᔅ ᔇ ᔈ ᔉ ᔊ ᔥ ᔾ ᕀ ᕁ ᕐ ᕝ ᕪ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᗮ ᘁ ᙇ ᙇ ᙇ ; Utökat block: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
Kombinera överskrift
  • Den Kombinerande diakritiska Marks blocket innehåller medeltida upphöjda bokstavs diakritiska tecken. Dessa bokstäver skrivs direkt ovanför andra bokstäver som förekommer i medeltida germanska manuskript, och därför innehåller dessa glyfer inte avstånd, till exempel uͤ. De visas här över den prickade cirkelplatshållaren ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
  • Den Kombinerande diakritiska Marks Extended blocket innehåller två kombinerar bokstäver för språk transkriptioner av Scots : ◌ᪿ ◌ᫀ.
  • Den Kombinerande diakritiska Marks Supplement blocket innehåller ytterligare medeltida upphöjd brev diakritiska tecken, tillräckligt för att slutföra grundläggande gemener latinska alfabetet förutom J, Q och y, några små huvudstäder och ligaturer (AE, AO, av) och ytterligare bokstäver: ◌ᷓ ◌ ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ.
  • De kyrilliska Extended -A och -B -blocken innehåller flera medeltida överskriftsdiakritiker, tillräckligt för att slutföra det grundläggande kyrilliska alfabetet som används i kyrkoslaviska texter, innehåller också en ytterligare ligatur (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
Index
  • Den latinska Extended-C- block innehåller ett ytterligare index, ⱼ.
  • Den fonetiska Extensions blocket har flera nedsänkta bokstäver och symboler: Latin / IPA ᵢ ᵣ ᵤ ᵥ och grekiska ᵦ ᵧ ᵨ ᵩ ᵪ.
Kombinera prenumeration

Latinska, grekiska och kyrilliska tabeller

Konsoliderad, Unicode -standarden innehåller över- och abonnemangsversioner av en delmängd av latinska, grekiska och kyrilliska bokstäver. Här är de ordnade i alfabetisk ordning för jämförelse (eller för att kopiera och klistra in). Eftersom dessa tecken visas i olika Unicode -intervall kan det hända att de inte verkar ha samma storlek eller position på grund av teckensnittsbyte i webbläsaren. Skuggade celler markerar små huvudstäder som inte skiljer sig särskilt mycket från minuscules och grekiska bokstäver som inte går att skilja från latin, och därför inte förväntas stödjas av Unicode.

Latinska över- och abonnemangsbokstäver
A B C D E F G H I J K L M N O P F R S T U V W X Y Z
Överskriftskapital ᴿ
Superscript liten keps 𐞄 𐞒 𐞖 𐞪 𐞲
Superscript minuscule ʰ ʲ ˡ 𐞥 ʳ ˢ ʷ ˣ ʸ
Överskrift liten keps ◌ᷛ ◌ᷞ ◌ᷟ ◌ᷡ ◌ᷢ
Överskrift liten ◌ͣ ◌ᷨ ◌ͨ ◌ͩ ◌ͤ ◌ᷫ ◌ᷚ ◌ͪ ◌ͥ ◌ᷜ ◌ᷝ ◌ͫ ◌ᷠ ◌ͦ ◌ᷮ ◌ͬ ◌ᷤ ◌ͭ ◌ͧ ◌ͮ ◌ᷱ ◌ͯ ◌ᷦ
Minimalt prenumeration
Underskrift liten ◌᷊ ◌ᪿ
Grekiska över- och underskriftsbrev
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Superscript minuscule ⁽ᵋ⁾ ᶿ ⁽ᶥ⁾ ⁽ᶹ⁾
Överskrift liten ◌ᷩ
Minimalt prenumeration

För grundläggande IPA, se överskrift IPA -bokstäver . Andra fonetiska symboler är,

andra IPA -över- och abonnemangsbrev
ɑ æ ç ð ə ɩ ʃ ƫ ʍ ʔ
Exponent 𐞃 ᶜ̧ ˀ
Överskrift ◌ᷧ ◌ᷔ ◌ᷗ ◌ᷙ ◌ᷪ ◌ᷯ ◌̉
Index
Underskrift ◌ᫀ
Kyrilliska över- och undertecknade bokstäver
А Ә Е Є И І Ї О Ө У Ү Ѡ Ъ ЪІ Ы Ь Ѣ Э Ѥ Ю Ѫ Ѭ Ѧ
Exponent * * * * * - * * * * * * * *
Överskrift ◌ⷶ ◌ⷷ ◌ꙴ ◌ꙵ ◌ꙶ ◌ⷪ ◌ꙷ ◌ⷹ ◌ꙻ ◌ꙸ ◌ꙹ ◌ꙺ ◌ⷺ ◌ⷼ ◌ꚟ ◌ⷻ ◌ⷾ ◌ⷿ ◌ⷽ
Index * * * * - * * * *
Б В Г Ґ Д Ж З S К Л М Н П Р С Т Ф Х Ц Ч Џ Ш Щ Ѳ
Exponent * * * * * * * * * * * * * * * * * *
Överskrift ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ꚞ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ
Index * * * * * * * * * * * * * * * * * *

*Tecken accepterade för Unicode 15, som ska publiceras 2022.

Se även små kepsar i Unicode .

Sammansatta tecken

Främst för kompatibilitet med tidigare teckenuppsättningar, innehåller Unicode ett antal tecken som komponerar super- och prenumerationer med andra symboler. I de flesta teckensnitt gör dessa mycket bättre än försök att konstruera dessa symboler från ovanstående tecken eller med hjälp av markering.

  • Den Unified Canadian Aboriginal Syllabics och dess utökade block innehåller flera bokstäver sammansatta med upphöjda bokstäver för att ange utökade sunda värderingar: Huvud blocket ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ Ext, Utökat block ᢰ ᢱ ᢲ ᢳ ᢴ ᢶ ᢷ ᢸ ᢺ ᢻ ᢼ ᢽ ᢾ ᢿ ᣀ ᣁ ᣂ ᣃ ᣅ ᣅ.

Anteckningar

Referenser