DNGS/Geocódigo: mudanças entre as edições

De Documentação
mSem resumo de edição
Linha 3: Linha 3:
== Desafios do bom geocódigo ==
== Desafios do bom geocódigo ==
<!-- old Mosaic-and-IDs.png  thumb|380px -->
<!-- old Mosaic-and-IDs.png  thumb|380px -->
[[Arquivo:Mosaic-voronoi-andIndex.png|miniaturadaimagem|Mosaicos são compostos de ladrilhos, seguindo um padrão qualquer, regular ou irregular. <br/>O requisito de P1 é que cubra toda a superfície, sem deixar buracos. Em P1 define-se '''identificador de ladrilhos''': cada ladrilho pode ser identificado por sua cor, mas em um banco de dados é importante que sejam rótulos numéricos ou códigos.]]
[[Arquivo:Mosaic-voronoi-andIndex.png|miniaturadaimagem|Mosaicos são compostos de ladrilhos, seguindo um padrão qualquer, regular ou irregular. <br/>O requisito de P1 é que cubra toda a superfície, sem deixar buracos. Em P1 define-se '''identificador de ladrilhos''': cada ladrilho pode ser identificado por seu nome (ex.cor), mas o mais curto é o rótulo numérico.]]


... colocando os problemas '''P''' na forma de perguntas:
... colocando os problemas '''P''' na forma de perguntas:
Linha 24: Linha 24:
** R: Aquele que satisfazer as (múltiplas) aplicações eleitas pela nação.
** R: Aquele que satisfazer as (múltiplas) aplicações eleitas pela nação.


* '''P5''': ''Qual base usar na representação posicional do índice?''
* '''P5''': ''Porque célula quadrada?''
** R: A adjacência entre células é um importante critério, para visualizar e facilitar cálculos, principalmente em aplicações logísticas. <br />[[Arquivo:DNGS-cellTypes.png|center|520px]] <br />Quadrados e triângulos exibem adjacência não uniforme porque têm vizinhos de aresta e vértice (Sahr et al. 2003), o ideal seriam hexágonos. Os quadrados ainda assim são razoáveis, por apresentarem adjacências regulares e proporção maior de adjacências-por-aresta (50% contra 25% do triângulo).
** R: Outro importante critério é o encaixe entre grades de níveis hierárquicos diferentes. <br />[[Arquivo:DGGS-cells-refinement.png|centro|semmoldura|580px]]<br/> O triângulo e o quadrado permitem encaixe perfeito (a célula-mãe ocupa exatamente a mesma área que as células-filhas).<br/> [[Arquivo:DGGS-coverH3-fail.png|centro|semmoldura|520px]]<br /> O hexágono, todavia, não permite, ele exige ou quebra de células (estratégia válida só para imagens de satélite), ou buracos e sobreposições: em aplicações para codificação de endereços, ou do tipo [[subpavimentação]] (para definir a demarcação de terras e a indexação de áreas), as operações exigem encaixe perfeito.
** R: Concluindo das opções acima, o melhor é garantir a multifinalidade, não descartando as coberturas,  aceitando a performance computacional "razoável" nas aplicações logísticas.
 
*'''P5''': ''Qual base usar na representação posicional do índice?''
**R: Prova matemática de que bons geocódigos emergem das potências de 2 na representação interna (outros números primos seriam menos compactos) e da potência da sua taxa de refinamento.
**R: Prova matemática de que bons geocódigos emergem das potências de 2 na representação interna (outros números primos seriam menos compactos) e da potência da sua taxa de refinamento.
**R: Prova matemática de que Triângulos não são boa solução para aplicações logísticas (e outras)
**R: Prova matemática de que Triângulos não são boa solução para aplicações logísticas (e outras)

Edição das 10h49min de 31 de outubro de 2023

Ver Geocódigo ou mover para cá.

Desafios do bom geocódigo

Mosaicos são compostos de ladrilhos, seguindo um padrão qualquer, regular ou irregular.
O requisito de P1 é que cubra toda a superfície, sem deixar buracos. Em P1 define-se identificador de ladrilhos: cada ladrilho pode ser identificado por seu nome (ex.cor), mas o mais curto é o rótulo numérico.

... colocando os problemas P na forma de perguntas:

  • P1: Porque geocódigo e grade amarrados?
    • R: Somente geocódigos de mosaicos sem buracos (conceito de "cobertura por ladrilhos") são solução, e para esse tipo de solução, necessariamente o geocódigo é um identificador de célula.
  • P2: Porque geocódigo (e grade) multifinalitário nacional?
    • R: Memorização de um padrão só, nacional. Por ser complexo, o humano precisa se acostumar com o sistema de grade com seus geocódigos, inclusive decorar certos geocódigos (ex. código postal de onde mora), ou memorizá-los temporariamente em discussões e comparações. Esse esforço de memorização só será realizado se houver motivação forte. A multifinalidade (portanto as múltiplas aplicações) potencializa a motivação. Precisa ser nacional, pois é a nação que unifica a cultura e tem força de Lei para impor padrões.
    • R: os governos nacionais precisam cumprir metas através de tecnologias espaciais, mesmo em governos limitados por sua "maturidade digital" e pobreza. Em particular os governos pobres se beneficiariam enormemente de padrões nacionais para geocódigos e de uma grade nacional.
    • R: conforme Open Data Index e INDE os dados precisam ser abertos, e abertura eficiente requer padronização.
  • P3: Porque grade regular hierárquica?
    • ...
    • R: somente as grades regulares hierárquicas resolvem de forma eficiente o problema geral (vide DGGS).
      • PS: a relação entre grade DGGS e geocódigo não precisa sempre ser direta. Geometricamente formas de sumarização diferentes das células-mãe são possíveis, permitindo derivação de grade secundária. Por exemplo os quadrados podem ser construídos de triângulos menores. Mas: essa estratégia iria contra a multifinalidade e reduziria performance de todas as aplicações.
  • P4: Qual índice usar na indexação espacial de latitude-longitude?
    • R: Qualquer curva de preenchimento. Ela vai possuir dependência geométrica com o formato da célula e sua taxa de refinamento, r. Por exemplo H3 Uber é hexagonal com taxa r=7, S2 Geometry é quadrilátero com r=4, Geohash é quadrilátero com r=32.
    • R: Aquele que satisfazer as (múltiplas) aplicações eleitas pela nação.
  • P5: Porque célula quadrada?
    • R: A adjacência entre células é um importante critério, para visualizar e facilitar cálculos, principalmente em aplicações logísticas.
      DNGS-cellTypes.png

      Quadrados e triângulos exibem adjacência não uniforme porque têm vizinhos de aresta e vértice (Sahr et al. 2003), o ideal seriam hexágonos. Os quadrados ainda assim são razoáveis, por apresentarem adjacências regulares e proporção maior de adjacências-por-aresta (50% contra 25% do triângulo).
    • R: Outro importante critério é o encaixe entre grades de níveis hierárquicos diferentes.
      DGGS-cells-refinement.png

      O triângulo e o quadrado permitem encaixe perfeito (a célula-mãe ocupa exatamente a mesma área que as células-filhas).
      DGGS-coverH3-fail.png

      O hexágono, todavia, não permite, ele exige ou quebra de células (estratégia válida só para imagens de satélite), ou buracos e sobreposições: em aplicações para codificação de endereços, ou do tipo subpavimentação (para definir a demarcação de terras e a indexação de áreas), as operações exigem encaixe perfeito.
    • R: Concluindo das opções acima, o melhor é garantir a multifinalidade, não descartando as coberturas, aceitando a performance computacional "razoável" nas aplicações logísticas.
  • P5: Qual base usar na representação posicional do índice?
    • R: Prova matemática de que bons geocódigos emergem das potências de 2 na representação interna (outros números primos seriam menos compactos) e da potência da sua taxa de refinamento.
    • R: Prova matemática de que Triângulos não são boa solução para aplicações logísticas (e outras)
    • R: Prova matemática de que Hexagonos não oferecem possibilidade de cobertura multi-resolução
  • ...