Szövegfeldolgozás - Text processing

P.Oxy.6.993 szöveg átírva.svg

A számítás során a szövegfeldolgozás kifejezés az elektronikus szöveg létrehozásának vagy manipulálásának automatizálásának elméletére és gyakorlatára utal. A szöveg általában az összes alfanumerikus karakterre utal, amely a gyakorlatot folytató személy billentyűzetén van megadva, de általában a szöveg azt az absztrakciós réteget jelenti, amely közvetlenül a célszöveg szokásos karakterkódolása felett helyezkedik el. A feldolgozás kifejezés automatizált (vagy gépesített) feldolgozásra utal, szemben a manuálisan végzett ugyanazzal a manipulációval.

A szövegfeldolgozás számítógépes parancsokat tartalmaz, amelyek tartalmat, tartalomváltozásokat és a kurzor mozgatását hívják elő, például

  • keres és cserél
  • formátum
  • - feldolgozott jelentés készítése a tartalomról, vagy
  • szűrhet egy fájlt vagy egy szöveges fájl jelentését.

A reguláris kifejezés szövegfeldolgozása egy virtuális szerkesztőgép, amelynek primitív programozási nyelve van, amely regisztereket (azonosítókat) és a szöveget tartalmazó karaktersorozatban elnevezett pozíciókat tartalmaz. Ezeket használva a "szövegszerkesztő" például kijelölhet egy szövegrészt, majd áthelyezheti azt. A szöveg feldolgozása segédprogram egy szűrő programot , vagy szűrő . Ez a két mechanizmus magában foglalja a szövegfeldolgozást.

Meghatározás

Mivel a szabványosított jelölések, például az ANSI menekülési kódok általában láthatatlanok a szerkesztő számára, átmeneti tulajdonságok halmazát tartalmazzák, amelyek időnként megkülönböztethetetlenné válnak a szövegszerkesztéstől . De a szövegfeldolgozás határozott megkülönböztetése az, hogy a szövegfeldolgozás megfelelő:

  • a "szövegszerkesztő segédprogramok", nem csak a "szövegszerkesztő" alkalmazások.
  • sokkal inkább "a billentyűzet módja", szemben a szerkesztés kezdeményezésének "egér útjával" (pl. fogd és vidd, vágd és illessze be).
  • szekvenciális hozzáférés, nem pedig véletlenszerű hozzáférés.
  • közvetlenül a prezentációs rétegnél működik, nem pedig közvetetten az alkalmazási rétegnél .
  • szabványosított és nyíltabban működő nyers adatokat dolgoz fel, semmilyen szabadalmaztatott módszer felé törekedve.

Ily módon az olyan jelölések, mint a betűtípus és a szín, nem igazán megkülönböztető tényezők, mivel a betűtípust és a színt befolyásoló karaktersorok egyszerűen szabványos karakterek, amelyeket a háttérszöveg-feldolgozó mód automatikusan beszúr, és amelyeket a megfelelő szövegszerkesztők átláthatóan működnek , ugyanakkor másképp válnak szövegfeldolgozási parancsként látható, ha ez a mód nincs érvényben. Tehát a szövegfeldolgozást alapvetően (de nem teljesen) a vizuális karakterek (vagy grafémák ) határozzák meg, nem pedig a szokásos, mégis láthatatlan karakterek.

Történelem

A számítógépes szövegfeldolgozás fejlesztése komolyan megkezdődött azzal, hogy Kleene formalizálta a szokásos nyelvet . Az ilyen reguláris kifejezések ezután egy fordítási folyamattal kiegészített miniprogrammá válhatnak, amely bármilyen szerkesztéshez rendelkezésre áll, ha ezt a nyelvet kibővítették. Hasonlóképpen, a szűrőket kibővítik az egyes opciók fejlesztésével .

Alapfogalmak

A szerkesztő lényegében meghív egy bemeneti adatfolyamot, és a szövegfeldolgozó környezetbe irányítja, amely vagy parancssor, vagy szövegszerkesztő . Az így kapott kimenet további szövegfeldolgozásra alkalmazható, amelynek végeredménye összehasonlítható algoritmus egyetlen alkalmazásával, amelyet egyszer egy kifinomultabb és strukturáltabb számítógépes program alkalmaz.

A szövegfeldolgozás az algoritmustól eltérően az egyszerűbb makrók manuálisan beadott szekvenciája, amelyek a minta-cselekvés kifejezései és a szűrési mechanizmusok. Mindkét esetben a programozó szándékát közvetett módon lenyűgözi egy adott szöveges karakterkészlet a szövegfeldolgozás során. A szövegfeldolgozási lépés eredménye néha csak reményteli, és a megkísérelt mechanizmus gyakran vizuális visszajelzés útján több piszkozat alá esik, amíg a reguláris kifejezés vagy a jelölőnyelv részletei, vagy a segédprogram opciói teljesen el nem ismerik.

A szövegfeldolgozás főleg a szöveges karakterek előállításával foglalkozik a számítás legmagasabb szintjén, ahol tevékenysége alig haladja meg a számítás gyakorlati felhasználását - az információk kézi továbbítását.

Végső soron minden számítástechnika szövegfeldolgozás, az összeszerelő önszerző szöveges karaktereitől kezdve az automatizált programozási nyelven keresztül, amelyet a grafikus adatok foltjának kezelésére hoztak létre, és végül a reguláris kifejezések metakaraktereihez, amelyek a meglévő szöveges dokumentumokat ápolják.

A szövegfeldolgozás a saját automatizálása.

Karakterek

A szöveges karakterek szabványosított karakterkészletben vannak, amelyek vezérlő karaktereket is tartalmaznak, például új vonalas karaktereket, amelyek rendezik a szöveget. Más típusú vezérlő karakterek gondoskodnak az átvitelről, meghatározzák a karakterkészleteket és más háztartási feladatokat hajtanak végre.

Lásd még

Külső linkek