Unicode -abonnemang och superscripts - Unicode subscripts and superscripts
Unicode har abonnemang och överskrift av ett antal tecken inklusive en hel uppsättning arabiska siffror . Dessa tecken gör att alla polynom , kemiska och vissa andra ekvationer kan representeras i klartext utan att använda någon form av markering som HTML eller TeX .
Den World Wide Web Consortium och Unicode Consortium har gjort rekommendationer om valet mellan att använda uppmärkning och använda upphöjda och nedsänkta tecken:
När det används i matematiskt sammanhang ( MathML ) rekommenderas det att konsekvent använda stilmarkering för överskrift och subskript .... Men när super- och subskript ska återspegla semantiska skillnader är det lättare att arbeta med dessa betydelser kodade i text snarare än markering, till exempel i fonetisk eller fonemisk transkription .
Användningsområden
Den avsedda användningen när dessa tecken lades till i Unicode var att tillåta kemiska formler och algebraformler och fonetik att skrivas utan markering, men producera sanna överskrift och abonnemang. Således "H ^ O" (med användning av en nedsänkt karaktär) är tänkt att vara identisk med "H 2 O" (med index markup).
I verkligheten ignorerar de flesta teckensnitt som innehåller dessa tecken Unicode -definitionen och utformar siffrorna för matematiska täljare och nämnare , som är mindre än normala tecken men är i linje med huvudlinjen respektive baslinjen . När de används med solidus är dessa glyfer användbara för att göra godtyckliga diagonala fraktioner (liknande ½ glyfen). Att göra fraktioner med hjälp av befintliga programvarusuper / abonnemang kräver många tecken och ser inte ut som den återgivna fraktionen (exempel: 1 / 2 ), så teckensnittsdesigners gav detta alternativ. Detta gör också de överskriftsbokstäverna användbara för ordinalindikatorer , vilket matchar characters- och º -tecknen närmare. Det gör dem emellertid felaktiga för vanliga super- och prenumerationer, och formler återges korrekt med hjälp av markering snarare än dessa tecken.
Unicode är avsett att producera diagonala fraktioner genom en annan mekanism men det stöds mycket dåligt. Den fraktion snedstreck U + 2044 är visuellt liknar solidus, men när den används med de vanliga siffrorna (inte de upphöjda och nedsänkt) är avsedd för att meddela en layoutsystem som en fraktion såsom ¾ skall visas med hjälp av automatisk glyf substitution för siffrorna . Vissa webbläsare stöder detta men inte i alla teckensnitt. Ett urval av teckensnitt visas i tabellen nedan.
| Tecken | Font | Resultat |
|---|---|---|
| U+00BD ½ VULGAR FRAKTION EN HALV | Standard | ½ |
| U+00B9 ¹ SUPERSCRIPT ONE , U+002F / SOLIDUS , U+2082 ₂ SUBSCRIPT TWO | ¹/₂ | |
| U+00B9 ¹ SUPERSCRIPT ONE , U+2044 ⁄ FRACTION SLASH , U+2082 ₂ SUBSCRIPT TWO | ¹⁄₂ | |
|
U+0031 1 DIGIT ONE , U+2044 ⁄ FRACTION SLASH , U+0032 2 DIGIT TWO |
1⁄2 | |
| Arial | 1⁄2 | |
| Cambria | 1⁄2 | |
| Konsoler | 1⁄2 | |
| Times New Roman | 1⁄2 | |
| FiraGO | 1⁄2 | |
| EB Garamond | 1⁄2 | |
| Cantarell | 1⁄2 | |
| Lato | 1⁄2 | |
| Linux Libertine O | 1⁄2 | |
| Nimbus Roman | 1⁄2 | |
| Ubuntu | 1⁄2 | |
| Yrsa | 1⁄2 |
Överskrifter och prenumerationer blockerar
De vanligaste överskriftssiffrorna (1, 2 och 3) fanns i ISO-8859-1 och fördes därför över till dessa positioner i Latin-1-serien av Unicode. Resten placerades i en dedikerad del av Unicode vid U+ 2070 till U+ 209F. De två tabellerna nedan visar dessa tecken. Varje över- eller prenumerationstecken föregås av ett normalt x för att visa prenumerationen/överskriften. Tabellen till vänster innehåller de faktiska Unicode -tecknen; den till höger innehåller ekvivalenter som använder HTML -markering för abonnemanget eller superscriptet.
|
|
Andra över- och underskriftstecken
Unicode version 13.0 innehåller också abonnemangs- och överskriftstecken som är avsedda för semantisk användning, i följande block:
- Exponent
- Den Latin-1 Supplement block innehåller det feminina och maskulina ordinal indikatorer ª och °.
- Den latinska Extended-C- block innehåller en ytterligare superscript, ⱽ.
- Det latinska Extended-D- blocket innehåller fem överskrift: ꝰ ꟸ ꟹ ꟲ ꟳ.
- Det latinska Extended-E- blocket innehåller fem överskrift: ꭜ ꭝ ꭞ ꭟ ꭩ.
- Det latinska Extended-F- blocket är helt och hållet superscript.
- Den Mellanrum Modifier Letters blocket har upphöjda bokstäver och symboler som används för fonetisk transkription: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ .
- Den fonetiska Extensions blocket har flera upphöjda bokstäver och symboler: Latin / IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, grekiska ᵝ ᵞ ᵟ ᵠ, kyrilliska ᵸ, andra ᵎ ᵔ ᵕ ᵙ ᵜ. Dessa är avsedda att indikera sekundär artikulation .
- Den fonetiska Extensions Tillägg blocket har flera mer: Latin / IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ , grekiska ᶿ.
- Det kyrilliska Extended-B- blocket innehåller två kyrilliska överskrift: ꚜ ꚝ.
- Det georgiska blocket innehåller ett övertryckt Mkhedruli -brev : ჼ.
- Den Kanbun blocket har upphöjd annotation tecken som används i japanska kopior av klassiska kinesiska texter: ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟ .
- Den Tifinagh blocket har en upphöjd bokstav: ⵯ.
- The Unified Canadian Aboriginal Syllabics och dess utökade block innehåller flera mestadels konsonant -bara bokstäver för att ange stavelse coda som kallas Finals, tillsammans med några tecken som anger stavelse medial känd som Medials: Huvudblock ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐣ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ᑉ ᑊ ᑋ ᒄ ᒄ ᒢ ᒻ ᒼ ᒽ ᒾ ᓑ ᓒ ᓪ ᓫ ᔅ ᔇ ᔈ ᔉ ᔊ ᔥ ᔾ ᕀ ᕁ ᕐ ᕝ ᕪ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᗮ ᘁ ᙇ ᙇ ᙇ ; Utökat block: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
- Kombinera överskrift
- Den Kombinerande diakritiska Marks blocket innehåller medeltida upphöjda bokstavs diakritiska tecken. Dessa bokstäver skrivs direkt ovanför andra bokstäver som förekommer i medeltida germanska manuskript, och därför innehåller dessa glyfer inte avstånd, till exempel uͤ. De visas här över den prickade cirkelplatshållaren ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
- Den Kombinerande diakritiska Marks Extended blocket innehåller två kombinerar bokstäver för språk transkriptioner av Scots : ◌ᪿ ◌ᫀ.
- Den Kombinerande diakritiska Marks Supplement blocket innehåller ytterligare medeltida upphöjd brev diakritiska tecken, tillräckligt för att slutföra grundläggande gemener latinska alfabetet förutom J, Q och y, några små huvudstäder och ligaturer (AE, AO, av) och ytterligare bokstäver: ◌ᷓ ◌ ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ.
- De kyrilliska Extended -A och -B -blocken innehåller flera medeltida överskriftsdiakritiker, tillräckligt för att slutföra det grundläggande kyrilliska alfabetet som används i kyrkoslaviska texter, innehåller också en ytterligare ligatur (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
- Index
- Den latinska Extended-C- block innehåller ett ytterligare index, ⱼ.
- Den fonetiska Extensions blocket har flera nedsänkta bokstäver och symboler: Latin / IPA ᵢ ᵣ ᵤ ᵥ och grekiska ᵦ ᵧ ᵨ ᵩ ᵪ.
- Kombinera prenumeration
- Den Kombinerande diakritiska Marks Supplement blocket innehåller en kombination av nedsänkt: ◌᷊.
Latinska, grekiska och kyrilliska tabeller
Konsoliderad, Unicode -standarden innehåller över- och abonnemangsversioner av en delmängd av latinska, grekiska och kyrilliska bokstäver. Här är de ordnade i alfabetisk ordning för jämförelse (eller för att kopiera och klistra in). Eftersom dessa tecken visas i olika Unicode -intervall kan det hända att de inte verkar ha samma storlek eller position på grund av teckensnittsbyte i webbläsaren. Skuggade celler markerar små huvudstäder som inte skiljer sig särskilt mycket från minuscules och grekiska bokstäver som inte går att skilja från latin, och därför inte förväntas stödjas av Unicode.
| A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | F | R | S | T | U | V | W | X | Y | Z | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Överskriftskapital | ᴬ | ᴮ | ꟲ | ᴰ | ᴱ | ꟳ | ᴳ | ᴴ | ᴵ | ᴶ | ᴷ | ᴸ | ᴹ | ᴺ | ᴼ | ᴾ | ꟴ | ᴿ | ᵀ | ᵁ | ⱽ | ᵂ | ||||
| Superscript liten keps | 𐞄 | 𐞒 | 𐞖 | ᶦ | ᶫ | ᶰ | 𐞪 | ᶸ | 𐞲 | |||||||||||||||||
| Superscript minuscule | ᵃ | ᵇ | ᶜ | ᵈ | ᵉ | ᶠ | ᵍ | ʰ | ⁱ | ʲ | ᵏ | ˡ | ᵐ | ⁿ | ᵒ | ᵖ | 𐞥 | ʳ | ˢ | ᵗ | ᵘ | ᵛ | ʷ | ˣ | ʸ | ᶻ |
| Överskrift liten keps | ◌ᷛ | ◌ᷞ | ◌ᷟ | ◌ᷡ | ◌ᷢ | |||||||||||||||||||||
| Överskrift liten | ◌ͣ | ◌ᷨ | ◌ͨ | ◌ͩ | ◌ͤ | ◌ᷫ | ◌ᷚ | ◌ͪ | ◌ͥ | ◌ᷜ | ◌ᷝ | ◌ͫ | ◌ᷠ | ◌ͦ | ◌ᷮ | ◌ͬ | ◌ᷤ | ◌ͭ | ◌ͧ | ◌ͮ | ◌ᷱ | ◌ͯ | ◌ᷦ | |||
| Minimalt prenumeration | ₐ | ₑ | ₕ | ᵢ | ⱼ | ₖ | ₗ | ₘ | ₙ | ₒ | ₚ | ᵣ | ₛ | ₜ | ᵤ | ᵥ | ₓ | |||||||||
| Underskrift liten | ◌᷊ | ◌ᪿ |
| Α | Β | Γ | Δ | Ε | Ζ | Η | Θ | Ι | Κ | Λ | Μ | Ν | Ξ | Ο | Π | Ρ | Σ | Τ | Υ | Φ | Χ | Ψ | Ω | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Superscript minuscule | ᵝ | ᵞ | ᵟ | ⁽ᵋ⁾ | ᶿ | ⁽ᶥ⁾ | ⁽ᶹ⁾ | ᵠ | ᵡ | |||||||||||||||
| Överskrift liten | ◌ᷩ | |||||||||||||||||||||||
| Minimalt prenumeration | ᵦ | ᵧ | ᵨ | ᵩ | ᵪ |
För grundläggande IPA, se överskrift IPA -bokstäver . Andra fonetiska symboler är,
| ɑ | æ | ç | ð | ə | ɩ | ᶅ | ʃ | ƫ | ʍ | ʔ | |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Exponent | ᵅ | 𐞃 | ᶜ̧ | ᶞ | ᵊ | ᶥ | ᶪ | ᶴ | ᶵ | ꭩ | ˀ |
| Överskrift | ◌ᷧ | ◌ᷔ | ◌ᷗ | ◌ᷙ | ◌ᷪ | ◌ᷯ | ◌̉ | ||||
| Index | ₔ | ||||||||||
| Underskrift | ◌ᫀ |
| А | Ә | Е | Є | И | І | Ї | О | Ө | У | Ү | Ꙋ | Ѡ | Ъ | ЪІ | Ы | Ь | Ѣ | Ꙗ | Э | Ѥ | Ю | Ѫ | Ѭ | Ѧ | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Exponent | * | * | * | * | * | - | * | * | * | * | ꚜ | * | * | ꚝ | * | * | |||||||||
| Överskrift | ◌ⷶ | ◌ⷷ | ◌ꙴ | ◌ꙵ | ◌ꙶ | ◌ⷪ | ◌ꙷ | ◌ⷹ | ◌ꙻ | ◌ꙸ | ◌ꙹ | ◌ꙺ | ◌ⷺ | ◌ⷼ | ◌ꚟ | ◌ⷻ | ◌ⷾ | ◌ⷿ | ◌ⷽ | ||||||
| Index | * | * | * | * | - | * | * | * | * | ||||||||||||||||
| Б | В | Г | Ґ | Д | Ж | З | S | К | Л | М | Н | П | Р | С | Т | Ф | Х | Ц | Ч | Џ | Ш | Щ | Ѳ | ||
| Exponent | * | * | * | * | * | * | * | * | * | ᵸ | * | * | * | * | * | * | * | * | * | ||||||
| Överskrift | ◌ⷠ | ◌ⷡ | ◌ⷢ | ◌ⷣ | ◌ⷤ | ◌ⷥ | ◌ⷦ | ◌ⷧ | ◌ⷨ | ◌ⷩ | ◌ⷫ | ◌ⷬ | ◌ⷭ | ◌ⷮ | ◌ꚞ | ◌ⷯ | ◌ⷰ | ◌ⷱ | ◌ⷲ | ◌ⷳ | ◌ⷴ | ||||
| Index | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | |||||||
*Tecken accepterade för Unicode 15, som ska publiceras 2022.
Se även små kepsar i Unicode .
Sammansatta tecken
Främst för kompatibilitet med tidigare teckenuppsättningar, innehåller Unicode ett antal tecken som komponerar super- och prenumerationer med andra symboler. I de flesta teckensnitt gör dessa mycket bättre än försök att konstruera dessa symboler från ovanstående tecken eller med hjälp av markering.
- Den Latin-1 Supplement block innehåller de förkomponerat fraktionerna ½, ¼, och ¾. Den copyright © och registrerat varumärke tecken ® är också i detta block.
- Den allmänna interpunktion blocket innehåller promille tecken ‰ och per tio tusen tecken ‱ och Basic Latin har procenttecken %.
- Den Siffer Formulär blocket innehåller flera förkomponerat fraktioner: ⅐ ⅑ ⅒ ⅓ ⅔ ⅕ ⅖ ⅗ ⅘ ⅙ ⅚ ⅛ ⅜ ⅝ ⅞ ⅟ ↉ .
- Den Letterlike Symboler blocket innehåller några symboler består av nedsänkt och upphöjd tecken: ℀ ℁ ℅ ℆ № ℠ ™ ⅍.
- Det bifogade alfanumeriska tilläggsblocket innehåller tre överskriftsförkortningar 🅪 🅫 🅬: MC för marque de commerce ( varumärke ), MD för marque déposée ( registrerat varumärke ), båda använda i Kanada; MR för marca registrada (registrerat varumärke) i spanska och portugisisktalande länder
- Den Diverse Teknisk blocket har ett ytterligare index, ett index 10 (⏨), i syfte att grundpotens .
- Den Unified Canadian Aboriginal Syllabics och dess utökade block innehåller flera bokstäver sammansatta med upphöjda bokstäver för att ange utökade sunda värderingar: Huvud blocket ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ Ext, Utökat block ᢰ ᢱ ᢲ ᢳ ᢴ ᢶ ᢷ ᢸ ᢺ ᢻ ᢼ ᢽ ᢾ ᢿ ᣀ ᣁ ᣂ ᣃ ᣅ ᣅ.