Coordonate paralele - Parallel coordinates

Coordonate paralele
Ggobi-purice2

Coordonatele paralele sunt un mod comun de vizualizare și analiză a seturilor de date de înaltă dimensiune .

Pentru a arăta un set de puncte într-un spațiu n- dimensional , este trasat un fundal format din n linii paralele , de obicei verticale și la distanțe egale. Un punct din spațiul n- dimensional este reprezentat ca o polilinie cu vârfuri pe axele paralele; poziția vârfului pe axa i -a corespunde coordonatei i - a punctului.

Această vizualizare este strâns legată de vizualizarea seriilor temporale , cu excepția faptului că este aplicată datelor în care axele nu corespund punctelor în timp și, prin urmare, nu au o ordine naturală. Prin urmare, aranjamente de ax diferite pot fi de interes.

Istorie

Despre coordonatele paralele erau deseori inventate de Philbert Maurice d'Ocagne (fr) în 1885, dar chiar dacă cuvintele „Coordonnées parallèles” apar în titlul cărții, această lucrare nu are nicio legătură cu tehnicile de vizualizare cu același nume; cartea descrie doar o metodă de transformare a coordonatelor. Dar chiar înainte de 1885, coordonatele paralele au fost folosite, de exemplu în „Rezumatul general al lui Henry Gannetts, care arată rangul statelor, după rapoarte, 1880”, sau ulterior în „rangul statelor și teritoriilor în populație de la fiecare recensământ, Henry Henry Gannetts, 1790- 1890 "în 1898. Au fost popularizate din nou 87 de ani mai târziu de Alfred Inselberg în 1985 și dezvoltate sistematic ca sistem de coordonate începând cu 1977. Unele aplicații importante sunt algoritmii de evitare a coliziunilor pentru controlul traficului aerian (1987-3 brevete SUA), extragerea datelor (Brevet SUA), viziune computerizată (brevet SUA), optimizare, control proces , mai recent în detectarea intruziunilor și în alte părți.

Dimensiuni mai mari

Pe planul cu un sistem de coordonate cartesian xy, adăugarea mai multor dimensiuni în coordonate paralele (adesea prescurtate || -coords sau PCP) implică adăugarea mai multor axe. Valoarea coordonatelor paralele este că anumite proprietăți geometrice în dimensiuni ridicate se transformă în modele 2D ușor de văzut. De exemplu, un set de puncte pe o linie în n- spațiu se transformă într-un set de polilinii în coordonate paralele, toate intersectându-se la n  - 1 puncte. Pentru n = 2, aceasta produce o dualitate punct-linie, indicând de ce fundamentele matematice ale coordonatelor paralele sunt dezvoltate în spațiul proiectiv, mai degrabă decât euclidian . O pereche de linii se intersectează într-un punct unic care are două coordonate și, prin urmare, poate corespunde unei linii unice care este, de asemenea, specificată de doi parametri (sau două puncte). În schimb, sunt necesare mai mult de două puncte pentru a specifica o curbă și, de asemenea, o pereche de curbe poate să nu aibă o intersecție unică. Prin urmare, prin utilizarea curbelor în coordonate paralele în loc de linii, dualitatea liniei punctelor se pierde împreună cu toate celelalte proprietăți ale geometriei proiective și modelele cunoscute de dimensiuni superioare corespunzătoare planurilor (hiper), curbelor, mai multor suprafețe netede (hiper) , proximități, convexitate și recent neorientabilitate. Scopul este de a mapa relațiile n-dimensionale în modele 2D. Prin urmare, coordonatele paralele nu sunt o mapare punct-la-punct, ci mai degrabă un subset n D la maparea subsetului 2D, nu există pierderi de informații. Notă: chiar și un punct din nD nu este mapat într-un punct în 2D, ci la o linie poligonală - un subset de 2D.

Considerații statistice

Image
Eșantion reprezentativ pentru coordonate paralele.

Atunci când sunt utilizate pentru vizualizarea datelor statistice, există trei considerații importante: ordinea, rotația și scalarea axelor.

Ordinea axelor este esențială pentru găsirea caracteristicilor și, în analiza tipică a datelor, vor trebui încercate multe reordonări. Unii autori au venit cu euristicile de ordonare care pot crea ordonări iluminante.

Rotația axelor este o translație în coordonatele paralele și dacă liniile intersectate în afara axelor paralele poate fi tradusă între ele prin rotații. Cel mai simplu exemplu în acest sens este rotirea axei cu 180 de grade.

Scalarea este necesară deoarece graficul se bazează pe interpolare (combinație liniară) a perechilor consecutive de variabile. Prin urmare, variabilele trebuie să fie la scară comună și există multe metode de scalare care trebuie luate în considerare ca parte a procesului de pregătire a datelor, care pot dezvălui puncte de vedere mai informative.

Un grafic de coordonate paralele lin se realizează cu spline. În graficul neted, fiecare observație este mapată într-o linie parametrică (sau curbă), care este netedă, continuă pe axe și ortogonală pentru fiecare axă paralelă. Acest design subliniază nivelul de cuantificare pentru fiecare atribut de date.

Citind

Inselberg ( Inselberg 1997 ) a făcut o revizuire completă a modului de citire vizuală a modelelor relaționale ale coordurilor paralele. Când majoritatea liniilor dintre două axe paralele sunt oarecum paralele între ele, sugerează o relație pozitivă între aceste două dimensiuni. Când liniile se încrucișează într-un fel de suprapunere a formelor X, este o relație negativă. Când liniile se încrucișează aleatoriu sau sunt paralele, arată că nu există nicio relație specială.

Limitări

În coordonate paralele, fiecare axă poate avea cel mult două axe vecine (una pe stânga și una pe dreapta). Pentru un set de date d-dimensional, cel mult relații d-1 pot fi afișate la un moment dat. În vizualizarea seriilor de timp , există un predecesor și un succesor natural; prin urmare, în acest caz special, există un aranjament preferat. Cu toate acestea, atunci când axele nu au o ordine unică, găsirea unui aranjament bun al axei necesită utilizarea euristicii și experimentarea. Pentru a explora relații mai complexe, axele trebuie reordonate.

Aranjând axele în spațiu tridimensional (totuși, încă în paralel, ca unghiile într-un pat de unghii), o axă poate avea mai mult de doi vecini într-un cerc în jurul atributului central, iar problema de aranjare devine mai ușoară (de exemplu prin folosind un copac de întindere minim ). Un prototip al acestei vizualizări este disponibil ca extensie la software-ul de extragere a datelor ELKI . Cu toate acestea, vizualizarea este mai greu de interpretat și de interacționat decât o ordine liniară.

Software

Deși există un număr mare de lucrări despre coordonatele paralele, există doar câteva programe notabile disponibile public pentru a converti bazele de date în grafice cu coordonate paralele. Software-uri notabile sunt ELKI , GGobi , Mondrian , Orange și ROOT . Bibliotecile includ Protovis.js , D3.js oferă exemple de bază. De asemenea, a fost publicat D3.Parcoords.js (o bibliotecă bazată pe D3) dedicată în mod special creației grafice de coordonate paralele. Structura de date Python și biblioteca de analiză Pandas implementează graficul de coordonate paralele, folosind biblioteca de graficare matplotlib .

Alte vizualizări pentru date multivariate

  • Diagrama radar - o vizualizare cu axe de coordonate dispuse radial
  • Graficul lui Andrews - transformata Fourier a unui grafic de coordonate paralele

Referințe

  1. ^ d'Ocagne, Maurice (1885). Coordonnées parallèles et axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèles . Paris: Gauthier-Villars.
  2. ^ Gannett, Henry. „Rezumat general care arată rangul statelor după rapoartele 1880” . Citați jurnalul necesită |journal=( ajutor )
  3. ^ Inselberg, Alfred (1985). „Planul cu coordonate paralele”. Computer vizual . 1 (4): 69–91. doi : 10.1007 / BF01898350 .
  4. ^ Inselberg, Alfred (2009). Coordonate paralele: Geometria multidimensională vizuală și aplicațiile sale . Springer. ISBN 978-0387215075.
  5. ^ Yang, Jing; Peng, Wei; Ward, Matthew O .; Rundensteiner, Elke A. (2003). „Dimensiunea ierarhică interactivă, ordonarea spațierii și filtrarea pentru explorarea seturilor de date cu dimensiuni ridicate” (PDF) . Simpozion IEEE privind vizualizarea informațiilor (INFOVIS 2003) : 3-4.
  6. ^ a b c Moustafa, Rida; Wegman, Edward J. (2006). "Date continue multivariate - coordonate paralele". În Unwin, A .; Theus, M .; Hofmann, H. (eds.). Grafica seturilor de date mari: vizualizarea unui milion . Springer. pp. 143–156. ISBN 978-0387329062.
  7. ^ Moustafa, Rida; Wegman, Edward J. (2002). „Pe unele generalizări ale graficelor de coordonate paralele” (PDF) . Seeing a Million, A Data Visualization Workshop, Rain Am Lech (Nr.), Germania . Arhivat din original (PDF) la 24.12.2013.
  8. ^ Inselberg, A. (1997), "Detectiv multidimensional", Vizualizare informație, 1997. Proceedings., IEEE Symposium on , pp. 100–107, doi : 10.1109 / INFVIS.1997.636793 , ISBN 0-8186-8189-6
  9. ^ Elke Achtert, Hans-Peter Kriegel , Erich Schubert, Arthur Zimek (2013). „Exploatarea interactivă a datelor cu copaci-coordonate paralele 3D”. Lucrările Conferinței internaționale ACM privind gestionarea datelor (SIGMOD) . New York, NY: 1009. doi : 10.1145 / 2463676.2463696 . ISBN 9781450320375.CS1 maint: nume multiple: lista autorilor ( link )
  10. ^ Kosara, Robert (2010). „Coordonate paralele” .
  11. ^ Coordonate paralele în panda

Lecturi suplimentare

  • Heinrich, Julian și Weiskopf, Daniel (2013) State of the Art of Parallel Coordinates , Eurographics 2013 - State of the Art Reports, pp. 95–116
  • Moustafa, Rida (2011) Diagramele de densitate a coordonatelor paralele și a coordonatelor paralele , Wiley Interdisciplinary Reviews: Computational Statistics, Vol 3 (2), pp. 134-148.
  • Weidele, Daniel Karl I. (2019) Conditional Parallel Coordinates , IEEE Visualization Conference (VIS) 2019, pp. 221-225

linkuri externe