Dokumentumfeldolgozás - Document processing

A dokumentumfeldolgozás olyan kutatási terület és gyártási folyamatok összessége, amelynek célja az analóg dokumentum digitálisvá tétele . A dokumentumfeldolgozásnak nem csupán célja a dokumentum fényképezése vagy szkennelése , hogy digitális képet kapjon , hanem az is, hogy digitálisan érthető legyen. Ez magában foglalja a dokumentum szerkezetének vagy az elrendezésnek , majd a tartalomnak a kibontását , amely lehet szöveg vagy kép. A folyamat magában foglalhatja a hagyományos számítógépes látás algoritmusait, a konvolúciós neurális hálózatokat vagy a fizikai munkát. A felmerülő problémák a szemantikai szegmentálással , az objektumfelismeréssel , az optikai karakterfelismeréssel (OCR) , a kézzel írt szövegfelismeréssel (HTR) és tágabb értelemben az átírással kapcsolatosak , akár automatikusak, akár nem. A kifejezés magában foglalja a fázis digitalizálása a dokumentumot a szkenner és a fázis értelmezése a dokumentumot, például a természetes nyelvi feldolgozás (NLP) , vagy kép besorolás technológiákat. Számos ipari és tudományos területen alkalmazzák az adminisztratív folyamatok optimalizálására, a levélfeldolgozásra, valamint az analóg archívumok és történelmi dokumentumok digitalizálására .

Háttér

A dokumentumfeldolgozás kezdetben ugyanúgy kiterjedt egyfajta gyártósoros munkára, amely a dokumentumok , például levelek és csomagok kezelésével foglalkozott, az adatok válogatása, kinyerése vagy tömeges kinyerése céljából. Ezt a munkát házon belül vagy üzleti folyamatok kiszervezésével lehet elvégezni . A dokumentumfeldolgozás valóban magában foglalhat valamilyen külső kézimunkát, például mechanikus törököt .

Példaként a kézi dokumentumfeldolgozásra, ami viszonylag nemrégiben, 2007 -ben történt, a "milliónyi vízum- és állampolgársági kérelem" dokumentumfeldolgozása "körülbelül 1000 szerződéses dolgozó" használatáról szólt, akik "a posta és adatbevitel kezelésén" dolgoznak .

Míg a dokumentumfeldolgozás jóval a számítógépes egér vagy a számítógépes szkenner használatát megelőzően billentyűzeten keresztül történő adatbevitelt jelentett , a The New York Times 1990 -ben megjelent cikke az úgynevezett " papírmentes irodának " azt állította, hogy "a dokumentumfeldolgozás a szkennerrel kezdődik". Ebben az összefüggésben a Xerox korábbi alelnöke, Paul Strassman kritikus véleményt fogalmazott meg, mondván, hogy a számítógépek inkább hozzáadják, mint csökkentik a papír mennyiségét az irodában. Azt mondták, hogy a repülőgép műszaki és karbantartási dokumentumai "többet nyomnak, mint maga a repülőgép".

Automatikus dokumentumfeldolgozás

A technika állásának előrehaladtával a dokumentumfeldolgozás áttért a "dokumentumkomponensek ... adatbázis -entitásokként" való kezelésére.

Az automatikus dokumentumfeldolgozásnak vagy néha intelligens dokumentumfeldolgozásnak (IDP) nevezett technológia az intelligens folyamat automatizálás (IPA) sajátos formájaként jelent meg , amely egyesíti a mesterséges intelligenciát, például a gépi tanulást (ML), a természetes nyelvfeldolgozást (NLP) vagy az intelligens karakterfelismerést (ICR) ), hogy adatokat nyerjen ki többféle dokumentumból.

Alkalmazások

Az automatikus dokumentumfeldolgozás a dokumentumok egész sorára vonatkozik, akár strukturált, akár nem. Például az üzleti életben és a pénzügyekben a technológiákat papír alapú számlák, nyomtatványok, vásárlási megbízások, szerződések és devizaszámlák feldolgozására lehet használni. A pénzintézetek intelligens dokumentumfeldolgozást alkalmaznak nagy mennyiségű nyomtatvány feldolgozására, mint például szabályozási űrlapok vagy kölcsöndokumentumok. Az IDP mesterséges intelligenciát használ az adatok kinyerésére és osztályozására a dokumentumokból, felváltva a kézi adatbevitelt.

Az orvostudományban dokumentumfeldolgozási módszereket fejlesztettek ki a betegek nyomon követésének megkönnyítése és az adminisztratív eljárások egyszerűsítése érdekében, különösen az orvosi vagy laboratóriumi elemzési jelentések digitalizálásával. A cél az orvosi adatbázisok egységesítése is. Az algoritmusokat közvetlenül is használják az orvosok diagnosztizálására, például mágneses rezonancia vagy mikroszkopikus képek elemzésével .

A dokumentumfeldolgozást széles körben használják a bölcsészettudományokban és a digitális humán tudományokban is , annak érdekében, hogy a történelmi nagy adatokat archívumokból vagy örökséggyűjteményekből nyerjék ki. Különleges megközelítéseket dolgoztak ki a különböző forrásokhoz, beleértve a szöveges dokumentumokat, például újságarchívumokat, de képeket vagy térképeket is.

Technológiák

Ha az 1980 -as évektől kezdve széles körben használták a hagyományos számítógépes látás algoritmusait a dokumentumfeldolgozási problémák megoldására, akkor ezeket a 2010 -es években fokozatosan felváltották a neurális hálózati technológiák. Egyes ágazatokban azonban még mindig használják a hagyományos számítógépes látástechnológiákat, néha neurális hálózatokkal együtt.

Számos technológia támogatja a dokumentumfeldolgozás fejlesztését, különösen az optikai karakterfelismerés (OCR) és a kézzel írt szövegfelismerés (HTR), amelyek lehetővé teszik a szöveg automatikus átírását. A szövegszegmenseket mint olyanokat példány- vagy objektumfelismerő algoritmusokkal azonosítják , amelyek néha a dokumentum szerkezetének észlelésére is felhasználhatók. Ez utóbbi probléma megoldása néha szemantikai szegmentációs algoritmusokat is alkalmaz .

Ezek a technológiák gyakran képezik a dokumentumfeldolgozás magját. Más algoritmusok azonban beavatkozhatnak ezek előtt vagy után. Valójában a dokumentumok digitalizálási technológiái is részt vesznek, akár klasszikus, akár háromdimenziós szkennelés formájában. A 3D dokumentumok digitalizálása különösen a fotogrammetria származékaihoz folyamodhat . Néha speciális 2D szkennereket is ki kell fejleszteni, hogy alkalmazkodjanak a dokumentumok méretéhez vagy a szkennelési ergonómia miatt. A dokumentumfeldolgozás függ a dokumentumok megfelelő fájlformátumú digitális kódolásától is . Továbbá a feldolgozás heterogén adatbázisok számíthatnak kép besorolás technológiákat.

A lánc másik végén különböző képfeldolgozási, extrapolációs vagy adattisztítási algoritmusok találhatók. A szöveges dokumentumok esetében az értelmezés természetes nyelvfeldolgozási (NLP) technológiákat alkalmazhat.

Lásd még

Hivatkozások