Procesní těžba - Process mining

Process mining je skupina technik, které se vztahují k oblastem datové vědy a správy procesů, aby podpořila analýzu provozních procesů na základě protokolů událostí. Cílem procesu mining je přeměnit data událostí na přehledy a akce. Procesová těžba je nedílnou součástí datové vědy, kterou podporuje dostupnost dat o událostech a touha zlepšit procesy. Techniky procesní těžby pomocí dat událostí ukazují, co lidé, stroje a organizace skutečně dělají. Procesová těžba poskytuje nové pohledy, které lze použít k identifikaci cesty provedení provozních procesů a řešení jejich problémů s výkonem a dodržováním předpisů.

Procesová těžba začíná daty událostí. Vstupem pro těžbu procesů je protokol událostí. Protokol událostí zobrazuje proces z určitého úhlu. Každá událost v protokolu by měla obsahovat (1) jedinečný identifikátor pro konkrétní instanci procesu (nazývaný case id), (2) aktivitu (popis události, ke které dochází) a (3) časové razítko. Mohou existovat další atributy událostí týkající se zdrojů, nákladů atd., Ale tyto jsou volitelné. S určitým úsilím lze taková data extrahovat z jakéhokoli informačního systému podporujícího provozní procesy. Procesová těžba používá tato data událostí k zodpovězení různých otázek souvisejících s procesy.

Existují tři hlavní třídy technik dolování procesů: zjišťování procesů , kontrola shody a vylepšení procesů . V minulosti se používaly termíny jako Workflow Mining a Automated Business Process Discovery (ABPD).

Přehled

Techniky procesní těžby se často používají tam, kde jiným přístupem nelze získat žádný formální popis procesu, nebo pokud je kvalita stávající dokumentace sporná. Například aplikace metodiky dolování procesů na auditní stopy systému řízení pracovního toku , transakční protokoly systému plánování podnikových zdrojů nebo elektronické záznamy pacientů v nemocnici mohou vést k modelům popisujícím procesy organizací. Analýzu protokolu událostí lze také použít ke srovnání protokolů událostí s předchozími modely, abychom pochopili, zda jsou pozorování v souladu s normativním nebo popisným modelem. Je požadováno, aby data protokolů událostí byla propojena s ID případu, aktivitami a časovými razítky  · .

Současné trendy řízení, jako je BAM ( Business Activity Monitoring ), BOM ( Business Operations Management ) a BPI ( business process intelligence ), ilustrují zájem o podporu diagnostických funkcí v kontextu technologie Business Process Management (např. Systémy řízení pracovního toku a další procesy -vědomé informační systémy). Procesová těžba se liší od hlavního strojového učení , dolování dat a technik umělé inteligence . Techniky zjišťování procesů v oblasti dolování procesů se například pokoušejí objevit procesní modely typu end-to-end, které jsou schopné popsat sekvenční, vztah výběru, souběžné a smyčkové chování. Techniky kontroly shody jsou blíže optimalizaci než tradičním přístupům k učení. Procesovou těžbu však lze použít ke generování strojového učení , dolování dat a problémů s umělou inteligencí . Po objevení modelu procesu a zarovnání protokolu událostí je možné vytvořit základní problémy s učením pod dohledem a bez dozoru. Například předvídat zbývající dobu zpracování běžícího případu nebo identifikovat hlavní příčiny problémů s dodržováním předpisů.

Pracovní skupina IEEE pro procesní těžbu byla založena v říjnu 2009 jako součást IEEE Computational Intelligence Society. Tato organizace nezávislá na prodejcích si klade za cíl podporovat výzkum, vývoj, vzdělávání a porozumění procesní těžbě, aby koncoví uživatelé, vývojáři, konzultanti a výzkumní pracovníci věděli o nejnovějším vývoji procesní těžby, podporovali používání technik a nástrojů procesní těžby a stimulovat nové aplikace, hrát roli ve snaze o standardizaci protokolování dat událostí (např. XES), organizovat výukové programy, speciální zasedání, workshopy, soutěže, panely a vyvíjet materiál (dokumenty, knihy, online kurzy, filmy atd.) s cílem informovat a vést lidi nové v oboru. IEEE Task Force on Process Mining založila sérii International Process Mining Conference (ICPM), vedla vývoj standardu IEEE XES pro ukládání a výměnu dat událostí a napsala Manifest procesní těžby, který byl přeložen do 16 jazyků.

Historie a místo v datové vědě

Pojem „procesní těžba“ byl poprvé vytvořen ve výzkumném návrhu napsaném nizozemským počítačovým vědcem Wil van der Aalstem („Kmotr procesní těžby“). Začala tak nová oblast výzkumu, která se objevila pod záštitou technik souvisejících s datovou vědou a procesní vědou na univerzitě v Eindhovenu v roce 1999. V počátcích byly techniky procesní těžby často spletité s technikami používanými pro řízení pracovního toku . V roce 2000 byl vyvinut úplně první prakticky použitelný algoritmus pro objevování procesů „ Alpha miner“ . Hned příští rok, v roce 2001, byl ve výzkumných dokumentech představen hodně podobný algoritmus založený na heuristice s názvem „ Heuristický miner “. Jak se oblast procesové těžby začala vyvíjet, její kontrola shody se stala její nedílnou součástí. Rok 2004 určil vývoj „přehrání založeného na tokenech“ pro účely kontroly shody. Kromě hlavních technik zjišťování procesů a kontroly shody se procesní těžba rozdělila do několika oblastí, což vedlo k objevu a rozvoji „ rozhodovací těžby “ a „ organizační těžby “ v roce 2005 a 2006. V roce 2007 byla založena vůbec první společnost pro těžbu komerčních procesů „Futura Pi“. V roce 2009 byla zřízena „ Pracovní skupina IEEE pro PM “, řídící orgán, který začal přehlížet normy a standardy související s procesní těžbou. Pro kontrolu shody byly vyvinuty další techniky, které vedly k publikování „ Kontroly shody založené na zarovnání “ v roce 2010. V roce 2011 byla vydána vůbec první kniha Process mining. Dále v roce 2014 Coursera nabídla kurz MOOC o procesní těžbě. Do roku 2018 bylo na obrázku téměř 30+ komerčně dostupných nástrojů pro těžbu procesů. Rok 2019 znamenal první konferenci Process mining. Dnes máme více než 35 prodejců, kteří nabízejí nástroje a techniky pro zjišťování procesů a kontrolu shody.

Procesová těžba je často mylně interpretována jako oblast související s datovou vědou. Na těžbu procesů je třeba pohlížet jako na most mezi datovou vědou a procesní vědou. Procesová těžba se zaměřuje na transformaci protokolu událostí na smysluplnou reprezentaci procesu, což může vést ke vzniku několika problémů souvisejících s datovou vědou a strojovým učením.

Kategorie

Existují tři kategorie technik procesní těžby.

  • Zjišťování procesů : První krok v procesu těžby. Hlavním cílem zjišťování procesů je transformovat protokol událostí do procesního modelu. Protokol událostí může pocházet z jakéhokoli systému pro ukládání dat, který zaznamenává aktivity v organizaci spolu s časovými razítky těchto aktivit. Takový protokol událostí musí obsahovat ID případu (jedinečný identifikátor k rozpoznání případu, do kterého aktivita patří), popis činnosti (textový popis provedené aktivity) a časové razítko provedení činnosti. Výsledkem zjišťování procesu je obecně model procesu, který je reprezentativní pro protokol událostí. Takový model procesu lze objevit například pomocí alfa algoritmu (didakticky řízený přístup). Mnoho známých technik existují pro automatické konstruování procesních modelů (například Petriho sítě , BPMN diagramy , diagramy aktivit , stavové diagramy , a EPC ) založené na protokolu událostí. V poslední době se výzkum těžby procesů začal zaměřovat na jiné perspektivy (např. Data, zdroje, čas atd.). Jedním z příkladů je technika popsaná v (Aalst, Reijers, & Song, 2005), kterou lze použít k vytvoření sociální sítě.
  • Kontrola shody : Pomáhá při porovnávání protokolu událostí s existujícím procesním modelem k analýze rozdílů mezi nimi. Takový procesní model lze vytvořit ručně nebo pomocí algoritmu zjišťování. Procesní model může například naznačovat, že nákupní objednávky nad 1 milion eur vyžadují dvě kontroly. Dalším příkladem je kontrola takzvaného principu „čtyř očí“. Kontrolu shody lze použít k detekci odchylek (kontrola souladu) nebo vyhodnocení algoritmů zjišťování nebo obohacení stávajícího procesního modelu. Příkladem je rozšíření procesního modelu o údaje o výkonu, tj.K promítnutí potenciálních úzkých míst je použitnějakýa prioriprocesní model. Dalším příkladem jerozhodovací minerpopsaný v (Rozinat & Aalst, 2006b), který berea prioriprocesní model a analyzuje každou volbu v procesním modelu. U každé možnosti je konzultován protokol událostí, aby se zjistilo, které informace jsou obvykle k dispozici v okamžiku výběru. Poté se používají klasické techniky dolování dat, aby se zjistilo, které datové prvky ovlivňují výběr. V důsledku toho je pro každou volbu v procesu generován rozhodovací strom.
  • Analýza výkonu : Používá se, když existuje apriorní model. Model je rozšířen o další informace o výkonu, jako jsou doby zpracování, doby cyklu, čekací doby, náklady atd., Takže cílem není kontrolovat shodu, ale spíše zlepšit výkon stávajícího modelu s ohledem na výkon určitého procesu. opatření. Příkladem je rozšíření procesního modelu o údaje o výkonu, tj. Některý předchozí procesní model dynamicky opatřený poznámkami o výkonových datech. Je také možné rozšířit procesní modely o další informace, jako jsou pravidla rozhodování a organizační informace (např. Role).

Viz také

Reference

Další čtení

  • Aalst, W. van der (2016). Process Mining: Data Science in Action. Springer Verlag, Berlin ( ISBN  978-3-662-49850-7 ).
  • Reinkemeyer, L. (2020). Procesní těžba v akci: zásady, případy použití a výhled. Springer Verlag, Berlin ( ISBN  978-3-030-40171-9 ).
  • Carmona, J., van Dongen, BF, Solti, A., Weidlich, M. (2018). Kontrola shody: Související procesy a modely. Springer Verlag, Berlin ( ISBN  978-3-319-99413-0 ).
  • Aalst, W. van der (2011). Procesní těžba: zjišťování, shoda a zdokonalování obchodních procesů. Springer Verlag, Berlin ( ISBN  978-3-642-19344-6 ).
  • Aalst, W. van der , Dongen, B. van, Herbst, J., Maruster, L., Schimm, G., & Weijters, A. (2003). Těžba pracovního postupu: Průzkum problémů a přístupů. Datové a znalostní inženýrství, 47 (2), 237–267.
  • Aalst, W. van der , Reijers, H., & Song, M. (2005). Objevování sociálních sítí z protokolů událostí. Počítačem podporovaná kooperativní práce, 14 (6), 549–593.
  • Jans, M., van der Werf, JM, Lybaert, N., Vanhoof, K. (2011) Aplikace pro těžbu podnikových procesů pro zmírnění vnitřních transakčních podvodů, Expert Systems with Applications, 38 (10), 13351–13359
  • Dongen, B. van, Medeiros, A., Verbeek, H., Weijters, A., & Aalst, W. van der (2005). Rámec ProM: Nová éra v podpoře nástrojů pro těžbu procesů. In G. Ciardo & P. ​​Darondeau (Eds.), Application and Theory of Petri Nets 2005 (Vol. 3536, pp. 444–454). Springer-Verlag, Berlín.
  • Aalst, W. van der . Praktický průvodce procesní těžbou: Omezení grafu přímo následuje. In International Conference on Enterprise Information Systems (Centeris 2019), volume 164 of Procedia Computer Science, pages 321-328. Elsevier, 2019.
  • Grigori, D., Casati, F., Castellanos, M., Dayal, U., Sayal, M., & Shan, M. (2004). Inteligence obchodních procesů. Počítače v průmyslu, 53 (3), 321–343.
  • Grigori, D., Casati, F., Dayal, U., & Shan, M. (2001). Zlepšení kvality obchodních procesů prostřednictvím porozumění výjimkám, predikce a prevence. In P. Apers, P. Atzeni, S. Ceri, S. Paraboschi, K. Ramamohanarao, & R. Snodgrass (Eds.), Proceedings of 27th international conference on Very Large Data Bases (VLDB'01) (pp. 159– 168). Morgan Kaufmann.
  • IDS Scheer. (2002). ARIS Process Performance Manager (ARIS PPM): Měření, analýza a optimalizace výkonu vašich obchodních procesů (whitepaper).
  • Ingvaldsen, JE a JA Gulla. (2006). Modelová těžba obchodních procesů. Journal of Information Systems Management, sv. 23, No. 1, Special Issue on Business Intelligence, Auerbach Publications
  • Kirchmer, M., Laengle, S., & Masias, V. (2013). Transparentnost správy obchodních procesů v nastavení zdravotní péče [Leading Edge]. Technology and Society Magazine, IEEE, 32 (4), 14-16.
  • zur Muehlen, M. (2004). Řízení procesů založené na pracovním toku: Základ, návrh a aplikace procesních informačních systémů řízených pracovním tokem. Loga, Berlín.
  • zur Muehlen, M., & Rosemann, M. (2000). Monitorování a řízení procesů na základě pracovního postupu-technické a organizační problémy. In R. Sprague (Ed.), Proceedings of the 33rd Hawaii international conference on system science (HICSS-33) (pp. 1–10). IEEE Computer Society Press, Los Alamitos, Kalifornie.
  • Rozinat, A., & Aalst, W. van der (2006b). Rozhodovací těžba v ProM. In S. Dustdar, J. Faideiro, & A. Sheth (Eds.), International Conference on Business Process Management (BPM 2006) (Vol. 4102, pp. 420–425). Springer-Verlag, Berlín.
  • Sayal, M., Casati, F., Dayal, U., & Shan, M. (2002). Kokpit obchodního procesu. In Sborník z 28. mezinárodní konference o velmi rozsáhlých databázích (VLDB'02) (s. 880–883). Morgan Kaufmann.
  • Huser V, Starren JB, EHR Předzpracování dat Usnadnění procesní těžby: aplikace na chronické onemocnění ledvin. Odkaz AMIA Annu Symp Proc 2009
  • Ross-Talbot S, Důležitost a potenciál popisů pro naše odvětví. Přednáška na 10. mezinárodní federované konferenci o distribuovaných výpočetních technikách [1]
  • Garcia, Cleiton dos Santos; Meincheim, Alex; a kol. (2019). Techniky a aplikace procesní těžby - Systematická mapovací studie ». Expertní systémy s aplikacemi. 133: 260–295. ISSN 0957-4174. doi: 10,1016/j.eswa.2019.05.003 [2]
  • van der Aalst, WMP a Berti A. Objevování Petriho sítí zaměřených na objekty. Fundamenta Informaticae, 175 (1-4): 1-40, 2020.

externí odkazy