Iniciativa de codificación de texto
El texto Encoding Initiative (TEI) es una organización fundada en 1987 ( organizado como un consorcio TEI desde 2000 ) y un formato de documento de la mismo nombre para la codificación y el intercambio de textos, las cuales se desarrolló y sigue desarrollando. En la versión actual P5 , el formato se basa en XML y se define en un metalenguaje del que se pueden derivar esquemas formales como DTD , esquema XML y esquema RELAX NG .
TEI se ha convertido en un estándar de facto dentro de las humanidades , donde se utiliza, por ejemplo, para codificar trabajos impresos ( ciencia de la edición ) o para marcar información lingüística ( lingüística ) en textos.
historia
TEI ha sido desde 1988 sobre la base de SGML desarrollado el primer borrador P1 ( P para propuesta en inglés - propuesta ) se publicó en 1990. Después de una versión provisional de P2 (1992), contenía las mejoras y correcciones, en 1994, que a su vez mejoró la versión P3 de TEI - la primera versión estable - adoptada. Con el desarrollo y la difusión de XML, TEI también tuvo que evolucionar. Para ello, el consorcio TEI se fundó en 2000. La primera versión XML P4 apareció en 2002, al mismo tiempo que se creó la versión TEI Lite con una gama reducida de elementos. La versión P5 se ha desarrollado desde 2005 y se publicó el 1 de noviembre de 2007. Ha sido revisado a fondo técnicamente y ampliado en términos de contenido, incluido un estándar para la descripción de manuscritos ( MASTER ).
tecnología
TEI se compone de varios módulos relacionados con el tema que contienen , por ejemplo, elementos para la estructura del documento, para marcar poemas y dramas, para marcar líneas y páginas individuales, para tablas, para comentarios críticos de texto o para corpus de idiomas , terminologías y diccionarios . Hay un núcleo de módulos que <p/>contienen elementos generales en cuanto a párrafos. Dependiendo del proyecto, este núcleo se puede ampliar para incluir los módulos necesarios que permiten un etiquetado muy diferenciado de las características del texto. El esquema TEI para una aplicación específica se define en sí mismo como un documento TEI en un metalenguaje (llamado documento ODD: Un documento lo hace todo ). Los esquemas formales como DTD , esquema XML y esquema Relax-NG se pueden generar automáticamente a partir del documento ODD . Los sitios web de TEI ofrecen herramientas tanto para adaptar TEI como para generar esquemas.
Ejemplos
Hola Mundo!
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>Hallo Welt!</title>
</titleStmt>
<publicationStmt>
<p>Demo für Wikipedia</p>
</publicationStmt>
<sourceDesc>
<p>Originales Werk, keine Vorlage</p>
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<body>
<p>Hallo Welt!</p>
</body>
</text>
</TEI>
Ejemplo practico
El siguiente ejemplo codifica un poema con información bibliográfica detallada , así como información en líneas y recuentos de páginas (TEI Lite).
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>Auf dem Brocken</title>
<author>Heinrich Heine (1797–1856)</author>
<respStmt>
<name>Wiki Autor</name>
<resp>Umwandlung in TEI-konformes XML</resp>
</respStmt>
</titleStmt>
<publicationStmt>
<p>aus Wikisource, der freien Quellensammlung
(<ptr target="http://de.wikisource.org/wiki/Auf_dem_Brocken"/>)</p>
</publicationStmt>
<sourceDesc>
<biblFull>
<titleStmt>
<title level="a">Auf dem Brocken</title>
<title level="m">Buch der Lieder</title>
<title level="m" type="sub">Aus der Harzreise</title>
<author>Heine, Heinrich</author>
</titleStmt>
<publicationStmt>
<publisher>Hoffmann und Campe</publisher>
<pubPlace>Hamburg</pubPlace>
<date>1827</date>
<availability>
<p>Gemeinfrei, keine Nutzungsbeschränkungen</p>
</availability>
</publicationStmt>
</biblFull>
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<body>
<pb n="302"/>
<head>Auf dem Brocken.</head>
<lg type="stanza">
<l>Heller wird es schon im Osten</l>
<l>Durch der Sonne kleines Glimmen,</l>
<l>Weit und breit die Bergesgipfel,</l>
<l>In dem Nebelmeere schwimmen.</l>
</lg>
<lg type="stanza">
<l n="5">Hätt’ ich Siebenmeilenstiefel,</l>
<l>Lief ich, mit der Hast des Windes,</l>
<l>Ueber jene Bergesgipfel,</l>
<l>Nach dem Haus des lieben Kindes.</l>
</lg>
<lg type="stanza">
<l>Von dem Bettchen, wo sie schlummert,</l>
<l n="10">Zög’ ich leise die Gardinen,</l>
<l>Leise küßt’ ich ihre Stirne,</l>
<l>Leise ihres Munds Rubinen.</l>
</lg>
<lg type="stanza">
<l>Und noch leiser wollt’ ich flüstern</l>
<l>In die kleinen Lilien-Ohren:</l>
<l n="15">Denk’ im Traum, daß wir uns lieben,</l>
<l>Und daß wir uns nie verloren.</l>
</lg>
</body>
</text>
</TEI>
Ver también
enlaces web
- Sitio web oficial del consorcio TEI
- TEI en la práctica
- Iniciativa de codificación de texto en GitHub
- Avistamientos en línea: "'Información de ayer mañana': la iniciativa de codificación de texto"
- Christof Schöch, Un formato de texto digital para estudios literarios: Las directrices de la Iniciativa de codificación de textos y su uso en la constitución y el análisis de textos, Romance Studies 4 (2016): 325–364.
Evidencia individual
- ↑ Matthew L. Jockers, Rosamond Thalken: Análisis de texto con R: para estudiantes de literatura (= métodos cuantitativos en humanidades y ciencias sociales ). Springer International Publishing, Cham 2020, ISBN 978-3-03039642-8 , págs. 134 , doi : 10.1007 / 978-3-030-39643-5 ( springer.com [consultado el 27 de abril de 2020]).
- ^ P5: Directrices para el intercambio y la codificación de texto electrónico. Antecedentes históricos tei-c.org
- ^ P5: Directrices para el intercambio y la codificación de texto electrónico. La infraestructura de TEI tei-c.org