DNGS/Geocódigo

De Documentação

No padrão DNGS o geocódigo é uma peça relevante, a finalidade do padrão é também garantir "bons geocódigos".

Desafios do bom geocódigo

Mosaicos são compostos de ladrilhos, seguindo um padrão qualquer, regular ou irregular.
O requisito de P1 é que cubra toda a superfície, sem deixar buracos. Em P1 define-se identificador de ladrilhos: cada ladrilho pode ser identificado por seu nome (ex.cor), mas o mais curto é o rótulo numérico.

... colocando os problemas P na forma de perguntas:

  • P1: Porque geocódigo e grade amarrados?
    • R: Somente geocódigos de mosaicos sem buracos (conceito de "cobertura por ladrilhos") são solução, e para esse tipo de solução, necessariamente o geocódigo é um identificador de célula.
  • P2: Porque geocódigo (e grade) multifinalitário nacional?
    • R: Memorização de um padrão só, nacional. Por ser complexo, o humano precisa se acostumar com o sistema de grade com seus geocódigos, inclusive decorar certos geocódigos (ex. código postal de onde mora), ou memorizá-los temporariamente em discussões e comparações. Esse esforço de memorização só será realizado se houver motivação forte. A multifinalidade (portanto as múltiplas aplicações) potencializa a motivação. Precisa ser nacional, pois é a nação que unifica a cultura e tem força de Lei para impor padrões.
    • R: os governos nacionais precisam cumprir metas através de tecnologias espaciais, mesmo em governos limitados por sua "maturidade digital" e pobreza. Em particular os governos pobres se beneficiariam enormemente de padrões nacionais para geocódigos e de uma grade nacional.
    • R: conforme Open Data Index e INDE os dados precisam ser abertos, e abertura eficiente requer padronização.
  • P3: Porque grade regular hierárquica?
    • P3.1: Porque mosaico hierárquico?
    • R: a subdivisão sucessiva das células gera um refinamento da resolução do mosaico. Pode-se escolher o mosaico com granulação apropriada, dentro de um sistema de mosaicos hierárquicos.
      Mosaic-voronoi-andIndex-subpav.png
    • R: a subpavimentação requer um sistema hierárquico de mosaicos, que possa ser usado novamente como mosaico, misturando mosaicos de diferentes níveis da hierarquia.
      Mosaic-voronoi-andIndex-subpavCut.png
    • P3.2: Porque grade regular?
    • R: somente as grades regulares hierárquicas resolvem de forma eficiente o problema geral (vide DGGS).
      • PS: a relação entre grade DGGS e geocódigo não precisa sempre ser direta. Geometricamente formas de sumarização diferentes das células-mãe são possíveis, permitindo derivação de grade secundária. Por exemplo os quadrados podem ser construídos de triângulos menores. Mas: essa estratégia iria contra a multifinalidade e reduziria performance de todas as aplicações.
  • P4: Qual índice usar na indexação espacial de latitude-longitude?
    • R: Qualquer curva de preenchimento. Ela vai possuir dependência geométrica com o formato da célula e sua taxa de refinamento, r. Por exemplo H3 Uber é hexagonal com taxa r=7, S2 Geometry é quadrilátero com r=4, Geohash é quadrilátero com r=32.
    • R: Aquele que satisfazer as (múltiplas) aplicações eleitas pela nação.
  • P5: Porque célula quadrada? ver DGGS/Cell
    • R: A adjacência entre células regular (por aresta) é um importante critério, para visualizar e facilitar cálculos, principalmente em aplicações logísticas. O hexágono possui o menor número de adjacências, 6, e a maior regularidade (100% das adjacências são por aresta).
      DNGS-cellTypes.png

      Quadrados e triângulos exibem adjacência não-uniforme porque têm vizinhos de aresta e vértice (Sahr et al. 2003), o ideal seriam hexágonos. Os quadrados ainda assim são razoáveis, por apresentarem quantidade menor de adjacências (8 contra 12 do triângulo), com proporção maior de adjacências-por-aresta (50% contra 25% do triângulo).
    • R: Outro importante critério é o encaixe entre grades de níveis hierárquicos diferentes.
      DGGS-cells-refinement.png

      O triângulo e o quadrado permitem encaixe perfeito (a célula-mãe ocupa exatamente a mesma área que as células-filhas). Esse encaixe é importante em aplicações para codificação de endereços e para subpavimentação (para definir a demarcação de terras e a indexação de áreas).
      DGGS-coverH3-fail.png

      O hexágono, todavia, não permite, ele exige ou quebra de células, ou buracos e sobreposições. No detalhe abaixo nota-se em amarelo os buracos e em vermelho as sobreposições.
      DGGS-coverH3-fail-Detail.png
    • R: Concluindo das opções acima, o melhor é garantir a multifinalidade, não descartando as coberturas, aceitando a performance computacional "razoável" nas aplicações logísticas.
  • P5: Qual base usar na representação posicional do índice?
    • R: Prova matemática de que bons geocódigos emergem das potências de 2 na representação interna (outros números primos seriam menos compactos) e da potência da sua taxa de refinamento.
    • R: Prova matemática de que Triângulos não são boa solução para aplicações logísticas (e outras)
    • R: Prova matemática de que Hexagonos não oferecem possibilidade de cobertura multi-resolução
  • ...