Iniziativa per la codifica del testo
La Text Encoding Initiative (TEI) è un'organizzazione fondata nel 1987 ( organizzata come un consorzio TEI dal 2000 ) e un formato di documento con lo stesso nome per la codifica e lo scambio di testi, che ha sviluppato e continua a sviluppare. Nell'attuale versione P5 , il formato è basato su XML ed è definito in un metalinguaggio da cui possono essere derivati schemi formali come DTD , schema XML e schema RELAX NG .
TEI si è sviluppato in uno standard de facto all'interno delle discipline umanistiche , dove viene utilizzato, ad esempio, per codificare opere a stampa ( scienza dell'edizione ) o per contrassegnare informazioni linguistiche ( linguistica ) nei testi.
storia
TEI è stato dal 1988 sulla base di SGML sviluppato la prima bozza P1 ( P per la proposta inglese - proposta ) è stata pubblicata nel 1990. Dopo una versione provvisoria di P2 (1992), conteneva i miglioramenti e le correzioni, nel 1994, che a sua volta ha migliorato la versione TEI P3 - la prima versione stabile - adottata. Con lo sviluppo e la diffusione di XML, TEI doveva essere ulteriormente sviluppato. A tal fine nel 2000 è stato fondato il consorzio TEI. La prima versione XML P4 è apparsa nel 2002, allo stesso tempo è stata creata la versione TEI Lite con una gamma di elementi ridotta. La versione P5 è stata sviluppata dal 2005 ed è stata rilasciata il 1 ° novembre 2007. È stato completamente rivisto tecnicamente e ampliato in termini di contenuto, incluso uno standard per la descrizione dei manoscritti ( MASTER ).
tecnologia
TEI è composto da vari moduli tematici che contengono , ad esempio, elementi per la struttura del documento, per contrassegnare poesie e drammi, per contrassegnare singole righe e pagine, per tabelle, per annotazioni testuali o per corpora linguistici , terminologia e dizionari . C'è un nucleo di moduli che <p/>contengono elementi generali come per i paragrafi. A seconda del progetto, questo nucleo può essere espanso per includere i moduli richiesti che consentono un'etichettatura molto differenziata delle caratteristiche del testo. Lo schema TEI per un'applicazione specifica è esso stesso definito come un documento TEI in un metalinguaggio (chiamato documento ODD: One Document Does it all ). Schemi formali come DTD , schema XML e schema Relax-NG possono essere generati automaticamente dal documento ODD . I siti web TEI offrono strumenti sia per adattare il TEI che per creare schemi.
Esempi
Ciao mondo!
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>Hallo Welt!</title>
</titleStmt>
<publicationStmt>
<p>Demo für Wikipedia</p>
</publicationStmt>
<sourceDesc>
<p>Originales Werk, keine Vorlage</p>
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<body>
<p>Hallo Welt!</p>
</body>
</text>
</TEI>
Esempio pratico
Il seguente esempio codifica una poesia con informazioni bibliografiche dettagliate nonché informazioni in linea e conteggi pagine (TEI Lite).
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>Auf dem Brocken</title>
<author>Heinrich Heine (1797–1856)</author>
<respStmt>
<name>Wiki Autor</name>
<resp>Umwandlung in TEI-konformes XML</resp>
</respStmt>
</titleStmt>
<publicationStmt>
<p>aus Wikisource, der freien Quellensammlung
(<ptr target="http://de.wikisource.org/wiki/Auf_dem_Brocken"/>)</p>
</publicationStmt>
<sourceDesc>
<biblFull>
<titleStmt>
<title level="a">Auf dem Brocken</title>
<title level="m">Buch der Lieder</title>
<title level="m" type="sub">Aus der Harzreise</title>
<author>Heine, Heinrich</author>
</titleStmt>
<publicationStmt>
<publisher>Hoffmann und Campe</publisher>
<pubPlace>Hamburg</pubPlace>
<date>1827</date>
<availability>
<p>Gemeinfrei, keine Nutzungsbeschränkungen</p>
</availability>
</publicationStmt>
</biblFull>
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<body>
<pb n="302"/>
<head>Auf dem Brocken.</head>
<lg type="stanza">
<l>Heller wird es schon im Osten</l>
<l>Durch der Sonne kleines Glimmen,</l>
<l>Weit und breit die Bergesgipfel,</l>
<l>In dem Nebelmeere schwimmen.</l>
</lg>
<lg type="stanza">
<l n="5">Hätt’ ich Siebenmeilenstiefel,</l>
<l>Lief ich, mit der Hast des Windes,</l>
<l>Ueber jene Bergesgipfel,</l>
<l>Nach dem Haus des lieben Kindes.</l>
</lg>
<lg type="stanza">
<l>Von dem Bettchen, wo sie schlummert,</l>
<l n="10">Zög’ ich leise die Gardinen,</l>
<l>Leise küßt’ ich ihre Stirne,</l>
<l>Leise ihres Munds Rubinen.</l>
</lg>
<lg type="stanza">
<l>Und noch leiser wollt’ ich flüstern</l>
<l>In die kleinen Lilien-Ohren:</l>
<l n="15">Denk’ im Traum, daß wir uns lieben,</l>
<l>Und daß wir uns nie verloren.</l>
</lg>
</body>
</text>
</TEI>
Guarda anche
link internet
- Sito ufficiale del consorzio TEI
- TEI in pratica
- Iniziativa per la codifica del testo su GitHub
- Avvistamenti online: "'Yesterday's Information Tomorrow': The Text Encoding Initiative"
- Christof Schöch, Un formato di testo digitale per gli studi letterari: le linee guida della Text Encoding Initiative e il loro uso nella costituzione del testo e nell'analisi del testo, Romance Studies 4 (2016): 325–364.
Prove individuali
- ↑ Matthew L. Jockers, Rosamond Thalken: Text Analysis with R: For Students of Literature (= Quantitative Methods in the Humanities and Social Sciences ). Springer International Publishing, Cham 2020, ISBN 978-3-03039642-8 , pagg. 134 , doi : 10.1007 / 978-3-030-39643-5 ( springer.com [visitato il 27 aprile 2020]).
- ^ P5: Linee guida per la codifica e l'interscambio di testi elettronici. Contesto storico tei-c.org
- ^ P5: Linee guida per la codifica e l'interscambio di testi elettronici. L'infrastruttura TEI tei-c.org