Szövegfeldolgozás - Text processing
A számítás során a szövegfeldolgozás kifejezés az elektronikus szöveg létrehozásának vagy manipulálásának automatizálásának elméletére és gyakorlatára utal. A szöveg általában az összes alfanumerikus karakterre utal, amely a gyakorlatot folytató személy billentyűzetén van megadva, de általában a szöveg azt az absztrakciós réteget jelenti, amely közvetlenül a célszöveg szokásos karakterkódolása felett helyezkedik el. A feldolgozás kifejezés automatizált (vagy gépesített) feldolgozásra utal, szemben a manuálisan végzett ugyanazzal a manipulációval.
A szövegfeldolgozás számítógépes parancsokat tartalmaz, amelyek tartalmat, tartalomváltozásokat és a kurzor mozgatását hívják elő, például
- keres és cserél
- formátum
- - feldolgozott jelentés készítése a tartalomról, vagy
- szűrhet egy fájlt vagy egy szöveges fájl jelentését.
A reguláris kifejezés szövegfeldolgozása egy virtuális szerkesztőgép, amelynek primitív programozási nyelve van, amely regisztereket (azonosítókat) és a szöveget tartalmazó karaktersorozatban elnevezett pozíciókat tartalmaz. Ezeket használva a "szövegszerkesztő" például kijelölhet egy szövegrészt, majd áthelyezheti azt. A szöveg feldolgozása segédprogram egy szűrő programot , vagy szűrő . Ez a két mechanizmus magában foglalja a szövegfeldolgozást.
Meghatározás
Mivel a szabványosított jelölések, például az ANSI menekülési kódok általában láthatatlanok a szerkesztő számára, átmeneti tulajdonságok halmazát tartalmazzák, amelyek időnként megkülönböztethetetlenné válnak a szövegszerkesztéstől . De a szövegfeldolgozás határozott megkülönböztetése az, hogy a szövegfeldolgozás megfelelő:
- a "szövegszerkesztő segédprogramok", nem csak a "szövegszerkesztő" alkalmazások.
- sokkal inkább "a billentyűzet módja", szemben a szerkesztés kezdeményezésének "egér útjával" (pl. fogd és vidd, vágd és illessze be).
- szekvenciális hozzáférés, nem pedig véletlenszerű hozzáférés.
- közvetlenül a prezentációs rétegnél működik, nem pedig közvetetten az alkalmazási rétegnél .
- szabványosított és nyíltabban működő nyers adatokat dolgoz fel, semmilyen szabadalmaztatott módszer felé törekedve.
Ily módon az olyan jelölések, mint a betűtípus és a szín, nem igazán megkülönböztető tényezők, mivel a betűtípust és a színt befolyásoló karaktersorok egyszerűen szabványos karakterek, amelyeket a háttérszöveg-feldolgozó mód automatikusan beszúr, és amelyeket a megfelelő szövegszerkesztők átláthatóan működnek , ugyanakkor másképp válnak szövegfeldolgozási parancsként látható, ha ez a mód nincs érvényben. Tehát a szövegfeldolgozást alapvetően (de nem teljesen) a vizuális karakterek (vagy grafémák ) határozzák meg, nem pedig a szokásos, mégis láthatatlan karakterek.
Történelem
A számítógépes szövegfeldolgozás fejlesztése komolyan megkezdődött azzal, hogy Kleene formalizálta a szokásos nyelvet . Az ilyen reguláris kifejezések ezután egy fordítási folyamattal kiegészített miniprogrammá válhatnak, amely bármilyen szerkesztéshez rendelkezésre áll, ha ezt a nyelvet kibővítették. Hasonlóképpen, a szűrőket kibővítik az egyes opciók fejlesztésével .
Alapfogalmak
A szerkesztő lényegében meghív egy bemeneti adatfolyamot, és a szövegfeldolgozó környezetbe irányítja, amely vagy parancssor, vagy szövegszerkesztő . Az így kapott kimenet további szövegfeldolgozásra alkalmazható, amelynek végeredménye összehasonlítható algoritmus egyetlen alkalmazásával, amelyet egyszer egy kifinomultabb és strukturáltabb számítógépes program alkalmaz.
A szövegfeldolgozás az algoritmustól eltérően az egyszerűbb makrók manuálisan beadott szekvenciája, amelyek a minta-cselekvés kifejezései és a szűrési mechanizmusok. Mindkét esetben a programozó szándékát közvetett módon lenyűgözi egy adott szöveges karakterkészlet a szövegfeldolgozás során. A szövegfeldolgozási lépés eredménye néha csak reményteli, és a megkísérelt mechanizmus gyakran vizuális visszajelzés útján több piszkozat alá esik, amíg a reguláris kifejezés vagy a jelölőnyelv részletei, vagy a segédprogram opciói teljesen el nem ismerik.
A szövegfeldolgozás főleg a szöveges karakterek előállításával foglalkozik a számítás legmagasabb szintjén, ahol tevékenysége alig haladja meg a számítás gyakorlati felhasználását - az információk kézi továbbítását.
Végső soron minden számítástechnika szövegfeldolgozás, az összeszerelő önszerző szöveges karaktereitől kezdve az automatizált programozási nyelven keresztül, amelyet a grafikus adatok foltjának kezelésére hoztak létre, és végül a reguláris kifejezések metakaraktereihez, amelyek a meglévő szöveges dokumentumokat ápolják.
A szövegfeldolgozás a saját automatizálása.
Karakterek
A szöveges karakterek szabványosított karakterkészletben vannak, amelyek vezérlő karaktereket is tartalmaznak, például új vonalas karaktereket, amelyek rendezik a szöveget. Más típusú vezérlő karakterek gondoskodnak az átvitelről, meghatározzák a karakterkészleteket és más háztartási feladatokat hajtanak végre.
Lásd még
Külső linkek
- A tárgy a könyv Automatikus szöveg feldolgozása által Gerard Salton
- Adatbázis szövegfeldolgozó eszközökkel (2013-10-23)
- Tartalomelemző szoftver Szoftver tartalomelemzéshez.
- Szövegeszközök Online Online Szövegfeldolgozó eszközök.