Coordenadas paralelas - Parallel coordinates

Coordenadas paralelas
Ggobi-flea2

Coordenadas paralelas são uma maneira comum de visualizar e analisar conjuntos de dados de alta dimensão .

Para mostrar um conjunto de pontos em um espaço n- dimensional , um pano de fundo é desenhado consistindo de n linhas paralelas , normalmente verticais e igualmente espaçadas. Um ponto no espaço n- dimensional é representado como uma polilinha com vértices nos eixos paralelos; a posição do vértice no i -ésimo eixo corresponde à i- ésima coordenada do ponto.

Essa visualização está intimamente relacionada à visualização de séries temporais , exceto que é aplicada a dados onde os eixos não correspondem a pontos no tempo e, portanto, não têm uma ordem natural. Portanto, diferentes arranjos de eixos podem ser de interesse.

História

Muitas vezes se dizia que as coordenadas paralelas foram inventadas por Philbert Maurice d'Ocagne (fr) em 1885, mas embora as palavras "Coordonnées parallèles" apareçam no título do livro, este trabalho não tem nada a ver com as técnicas de visualização do mesmo nome; o livro descreve apenas um método de transformação de coordenadas. Mas mesmo antes de 1885, as coordenadas paralelas foram usadas, por exemplo em Henry Gannetts "Resumo Geral, Mostrando a Classificação dos Estados, por Razões, 1880", ou posteriormente em Henry Gannetts "Classificação dos Estados e Territórios na População em Cada Censo, 1790- 1890 "em 1898. Eles foram popularizados novamente 87 anos depois por Alfred Inselberg em 1985 e sistematicamente desenvolvidos como um sistema de coordenadas a partir de 1977. Algumas aplicações importantes estão em algoritmos de prevenção de colisão para controle de tráfego aéreo (patentes dos EUA de 1987-3), mineração de dados (Patente dos EUA), visão computacional (patente dos EUA), Otimização, controle de processos , mais recentemente em detecção de intrusão e outros.

Dimensões superiores

No plano com um sistema de coordenadas cartesianas xy, adicionar mais dimensões em coordenadas paralelas (frequentemente abreviado como || -coords ou PCP) envolve adicionar mais eixos. O valor das coordenadas paralelas é que certas propriedades geométricas em dimensões altas se transformam em padrões 2D facilmente vistos. Por exemplo, um conjunto de pontos em uma linha no espaço n se transforma em um conjunto de polilinhas em coordenadas paralelas, todas se cruzando em n  - 1 pontos. Para n = 2, isso resulta em uma dualidade ponto-linha apontando por que os fundamentos matemáticos das coordenadas paralelas são desenvolvidos no espaço projetivo em vez de no euclidiano . Um par de linhas se cruza em um único ponto que possui duas coordenadas e, portanto, pode corresponder a uma única linha que também é especificada por dois parâmetros (ou dois pontos). Em contraste, mais de dois pontos são necessários para especificar uma curva e também um par de curvas pode não ter uma interseção exclusiva. Portanto, ao usar curvas em coordenadas paralelas em vez de linhas, a dualidade da linha do ponto é perdida juntamente com todas as outras propriedades da geometria projetiva, e os padrões de dimensões superiores conhecidos correspondentes a (hiper) planos, curvas, várias (hiper) superfícies lisas , proximidades, convexidade e recentemente não orientabilidade. O objetivo é mapear relações n-dimensionais em padrões 2D. Portanto, as coordenadas paralelas não são um mapeamento ponto a ponto, mas sim um subconjunto n D para mapeamento de subconjunto 2D, não há perda de informação. Nota: mesmo um ponto em nD não é mapeado em um ponto em 2D, mas em uma linha poligonal - um subconjunto de 2D.

Considerações estatísticas

Image
Amostra representativa para coordenadas paralelas.

Quando usado para visualização de dados estatísticos, há três considerações importantes: a ordem, a rotação e a escala dos eixos.

A ordem dos eixos é crítica para encontrar recursos e, na análise de dados típica, muitos reordenamentos precisarão ser tentados. Alguns autores criaram heurísticas de ordenação que podem criar ordenações esclarecedoras.

A rotação dos eixos é uma translação nas coordenadas paralelas e se as linhas se cruzam fora dos eixos paralelos, pode ser transladada entre eles por rotações. O exemplo mais simples disso é girar o eixo em 180 graus.

A escala é necessária porque o gráfico é baseado na interpolação (combinação linear) de pares consecutivos de variáveis. Portanto, as variáveis ​​devem estar em uma escala comum e há muitos métodos de escala a serem considerados como parte do processo de preparação de dados que podem revelar visualizações mais informativas.

Uma plotagem de coordenada paralela suave é obtida com splines. No gráfico suave, cada observação é mapeada em uma linha (ou curva) paramétrica, que é suave, contínua nos eixos e ortogonal a cada eixo paralelo. Este projeto enfatiza o nível de quantização para cada atributo de dados.

Leitura

Inselberg ( Inselberg 1997 ) fez uma revisão completa de como ler visualmente os padrões relacionais dos coords paralelos. Quando a maioria das linhas entre dois eixos paralelos são um tanto paralelas entre si, isso sugere uma relação positiva entre essas duas dimensões. Quando as linhas se cruzam em uma espécie de superposição de formas em X, é uma relação negativa. Quando as linhas se cruzam aleatoriamente ou são paralelas, isso mostra que não há uma relação particular.

Limitações

Em coordenadas paralelas, cada eixo pode ter no máximo dois eixos vizinhos (um à esquerda e outro à direita). Para um conjunto de dados d-dimensional, no máximo relacionamentos d-1 podem ser mostrados por vez. Na visualização de séries temporais , existe um predecessor e sucessor naturais; portanto, neste caso especial, existe um arranjo preferencial. No entanto, quando os eixos não têm uma ordem única, encontrar um bom arranjo de eixos requer o uso de heurísticas e experimentação. Para explorar relacionamentos mais complexos, os eixos devem ser reordenados.

Ao organizar os eixos no espaço tridimensional (no entanto, ainda em paralelo, como pregos em um leito de pregos), um eixo pode ter mais de dois vizinhos em um círculo em torno do atributo central, e o problema de arranjo fica mais fácil (por exemplo, por usando uma árvore geradora mínima ). Um protótipo desta visualização está disponível como extensão para o software de mineração de dados ELKI . No entanto, a visualização é mais difícil de interpretar e interagir do que uma ordem linear.

Programas

Embora haja um grande número de artigos sobre coordenadas paralelas, existem poucos softwares notáveis ​​disponíveis publicamente para converter bancos de dados em gráficos de coordenadas paralelas. Softwares notáveis ​​são ELKI , GGobi , Mondrian , Orange e ROOT . Bibliotecas incluem Protovis.js , D3.js fornece exemplos básicos. D3.Parcoords.js (uma biblioteca baseada em D3) especificamente dedicada à criação gráfica de coordenadas paralelas também foi publicada. A estrutura de dados Python e biblioteca de análise Pandas implementa plotagem de coordenadas paralelas, usando a biblioteca de plotagem matplotlib .

Outras visualizações para dados multivariados

  • Gráfico de radar - uma visualização com eixos coordenados dispostos radialmente
  • Gráfico de Andrews - a transformada de Fourier de um gráfico de coordenadas paralelas

Referências

  1. ^ d'Ocagne, Maurice (1885). Coordonnées parallèles et axiales: Método de transformação géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèles . Paris: Gauthier-Villars.
  2. ^ Gannett, Henry. "Resumo geral mostrando a classificação dos estados por proporções 1880" . Citar diário requer |journal=( ajuda )
  3. ^ Inselberg, Alfred (1985). "O plano com coordenadas paralelas". Visual Computer . 1 (4): 69–91. doi : 10.1007 / BF01898350 .
  4. ^ Inselberg, Alfred (2009). Coordenadas Paralelas: Geometria Multidimensional VISUAL e suas Aplicações . Springer. ISBN 978-0387215075.
  5. ^ Yang, Jing; Peng, Wei; Ward, Matthew O .; Rundensteiner, Elke A. (2003). "Espaçamento e filtragem de ordenação de dimensão hierárquica interativa para exploração de conjuntos de dados dimensionais elevados" (PDF) . Simpósio IEEE sobre Visualização de Informação (INFOVIS 2003) : 3-4.
  6. ^ a b c Moustafa, Rida; Wegman, Edward J. (2006). "Dados contínuos multivariados - Coordenadas paralelas". Em Unwin, A .; Theus, M .; Hofmann, H. (eds.). Gráficos de grandes conjuntos de dados: visualizando um milhão . Springer. pp. 143–156. ISBN 978-0387329062.
  7. ^ Moustafa, Rida; Wegman, Edward J. (2002). "Sobre algumas generalizações de gráficos de coordenadas paralelas" (PDF) . Seeing a Million, A Data Visualization Workshop, Rain Am Lech (Nr.), Germany . Arquivado do original (PDF) em 24/12/2013.
  8. ^ Inselberg, A. (1997), "Multidimensional detective", Information Visualization, 1997. Proceedings., IEEE Symposium on , pp. 100-107, doi : 10.1109 / INFVIS.1997.636793 , ISBN 0-8186-8189-6
  9. ^ Elke Achtert, Hans-Peter Kriegel , Erich Schubert, Arthur Zimek (2013). "Mineração de dados interativa com árvores de coordenadas paralelas 3D". Proceedings of the ACM International Conference on Management of Data (SIGMOD) . New York City, NY: 1009. doi : 10.1145 / 2463676.2463696 . ISBN 9781450320375.CS1 maint: vários nomes: lista de autores ( link )
  10. ^ Kosara, Robert (2010). "Coordenadas paralelas" .
  11. ^ Coordenadas paralelas em pandas

Leitura adicional

  • Heinrich, Julian e Weiskopf, Daniel (2013) State of the Art of Parallel Coordinates , Eurographics 2013 - State of the Art Reports, pp. 95–116
  • Moustafa, Rida (2011) Coordenadas paralelas e gráficos de densidade de coordenadas paralelas , Wiley Interdisciplinary Reviews: Computational Statistics, Vol 3 (2), pp. 134-148.
  • Weidele, Daniel Karl I. (2019) Conditional Parallel Coordinates , IEEE Visualization Conference (VIS) 2019, pp. 221–225

links externos