osmc:Convenções/Grade científica multifinalitária

De Documentação
< osmc:Convenções
Revisão de 09h07min de 15 de junho de 2024 por Peter (discussão | contribs) (→‎Requisitos)
(dif) ← Edição anterior | Revisão atual (dif) | Versão posterior → (dif)

Requisitos de uma Grade Multifinalitária. Lançados em [KraEtAll2022a], os requisitos foram melhor detalhamos em 2023, orientando-se pelos resultados do Open Data Index.

Requisitos

O padrão DNGS busca preservar o máximo das aplicações do padrão DGGS, consequentemente boa parte dos requisitos. Os requisitos específicos do DNGS podem ser resumidos da seguinte forma:

  • Comparabilidade direta entre grades de diferentes países: formato e área de célula padronizados.
    • Justificativa: para que as informações contidas nas grades de diferentes países possam ser comparadas entre si. Aplicações científicas e estatísticas exigem que as áreas sejam iguais e as células com formato semelhante.
  • Grade geometricamente hierárquica: a união geométrica das células-filhas resultando exatamente na célula-mãe.
    • Justificativa: para aplicações geométricas baseadas em cobertura e aplicações baseadas em geocódigos hierárquicos. Álgebras de grade também exigem consistência entre diferentes escalas, resultando em sistemas hierárquicos.
  • Geocódigos com hierarquia consistente, e máxima eficiência na compactação da informação.
    • Justificativa: aplicações baseadas em geocódigos hierárquicos, complemento das aplicações das geometrias hierárquica. Álgebras simbólicas de grade (com geocódigos ou sua representação binária) substituem a álgebra geométrica em alguns casos, oferecendo performance muito maior.
  • Máxima interoperabilidade entre geocódigos logístico e científico: na eventual decisão soberana de ter dois geocódigos ao invés de apenas um, porém ambos rotulando a mesma grade.
    • Justificativa: a referência numa mesma grade (logística subconjunto da científica) garante interoperabilidade operacional. A fácil (alta performance) conversão entre geocódigos garante a aplicações secundárias.

Nota: os requisitos de grade e geocódigo levaram à definição do GGeohash.

Convenção resultante

Tamanhos de grade quadrada, seguindo-se, de baixo para cima, as potências de 2 a partir do metro.
O nível L0 do Brasil (BR), por ser um país de área maior, requer células de cobertura maiores do que a Colômbia (CO).

As grades DNGS são quadriláteras, pressupondo algoritmos GGeohash. São classificadas pelo tamanho do lado hL de suas células de nível L. Partindo de L0 as células são refinadas dividindo-se a célula-mãe por 4. As células-filha são organizadas numa matriz quadrada 2×2, com 2 unidades de lado: do processo de refinamentos sucessivos resulta o padrão de grades baseado em uma série de potências de 2.

Osmc-refinamentoQuadrada-v2.png

O requisito da "comparabilidade direta entre grades" (de diferentes países) demanda a escolha de uma célula de referência: adotou-se a célula de 1 metro quadrado (1 m²) como referência no padrão DNGS. Características, conforme tabela ao lado, com níveis L de BR e CO, e colunas "power of 2" e value:

As potências de 2 são: ; ; ; ; ...; ; ...; ; .
Cada país tem seu h0 conforme cobertura nacional:
no Brasil h0=1 Mim ≈ 1049 km;
na Colômbia h0=512 Kim ≈ 524 km.
Série h20, h19, ..., h0, das células lado hL do Brasil: 1 m; 2 m; 4 m; 8 m; 16 m; ... 1048576 m.
Série h19, h17, ..., h0, das células lado hL da Colômbia: 1 m; 2 m; 4 m; 8 m; 16 m; ...; 524288 m.

Prefixos binários

Conforme as convenções IEC para prefixos binários, os prefixos K (quilo) e M (mega) foram adaptados para a notação posicional binária (potências de 2) da seguinte forma, partindo da lingua inglesa: "K binary" simbolizado Ki (pronuncia-se "kibi") e "M binary" simbolizado Mi (pronuncia-se "mebi").
Em valores, ; .

Aplicados à grandeza byte (B) formam o "kibi byte", KiB, e o "mebi byte", MiB.
Analogamente, aplicados à grandeza metro (m) formam o "kibi meter", Kim, e o "mebi meter", Mim.

  •    (2% a mais que )
  •    (5% a mais que )

Cobertura L0 de cada país

Cada país tem a liberdade de escolher a projeção e a cobertura (nível L0) mais adequadas. Como a grade de cobertura tem seus geocódigos expressos na base16h, o padrão DNGS recomenda que a cobertura tenha no máximo 16 células, garantindo geocódigos mais curtos para as suas células.

Comparabilidade nos níveis superiores

Exceto pelo Vaticano, todos os países possuem cobertura L0 com lado maior que 100 km, de modo que dois países que adotam o padrão DNGS poderão comparar as informações contidas em células de grade de mesmo tamanho.

Brasil e Colômbia podem ter suas células comparadas a partir dos 524 km, valendo a comparabilidade para todas as escalas até 1 m.

Grades degeneradas de nível meio

Em aplicações que não são afetadas pela perda de uniformidade e simetria da geometria da grade, é possível fazer uso da grade degenerada, com geocódigos expressos na base Base h, e viabilizando bases não-múltiplas de 4 (taxa de refinamento GGeohash adotada), como a base32.

No exemplo abaixo, com taxa de refinamento 4, é natural a escolha da base4, e a base 4h pode ser adotada para os geocódigos das grades degeneradas.

GGeohash-base4-niveisMeio.png

As grades degeneradas são também ditas "de nível meio", pois correspondem a níveis hierárquicos intermediários: L½, L1½, L2½, L3½, etc. O algoritmo para a geração da representação geométrica das grades degeneradas, inclusive para o caso mais complexo da Curva de Hilbert, é apresentado em Generalized Geohash/pt#Representação geométrica.

Com taxa de refinamento 4 outras notações posicionais de código também poderiam ser utilizadas, bases 8, 8h, 16, 16h, 32 e 64, restringindo-se as grades:

Notação Dígitos de Grades
Base 8 3 bits de 1 célula; de 23=8 células (degenerada); de 26=64 células; de 29=512 células (degenerada); ...
Base 8h livre todas as grades, degeneradas ou não.
Base 16 4 bits de 1 célula; de 24=16 células; de 28=256 células; de 212=4096 células; de 216=65536 células; ...
Base 16h livre todas as grades, degeneradas ou não.
Base 32 5 bits de 1 célula; de 25=32 células (degenerada); de 210=1024 células; de 215=32768 células (degenerada); ...
Base 64 6 bits de 1 célula; de 26=64 células; de 212=4096 células; de 218=262144 células; ...
Nota. As bases 8h e 16h possuem hierarquia restrita, equivalente à base "sem h"; ou seja, hierarquia a cada 3 bits na 8h, a cada 4 bits na 16h.

A base32 é utilizada em países de território maior, para gerar o geocódigo logístico, e a base 16h foi eleita como padrão na grade científica. O geocódigo base32 só tem representação geométrica onde existe geocódigo, o que corresponde às grades de nível L0, L2½, L5, L7½, L10, etc.

GGeohash-niveis-base32.png

A base32 é um subconjunto da base16h. O geocódigo base16h está disponível em todos os níveis, mas apresenta hierarquia apenas na base16, ou seja, nas grades de nível inteiro par, L0, L2, L4, L6, etc.

GGeohash-Niveis-Base16h.png

Ver animações em https://git-site.osm.codes/Sfc4q/

Diferentes geocódigos

Nos países onde os geocódigos "científicos" não podem ser adotados como "logísticos" por serem muito longos, comprime-se um pouco mais através da adaptação da notação base32. Perdem-se níveis hierárquicos, de modo que a nova notação logística e sua grade, serão subconjunto da grade e notação científicas.

Por exemplo na Colômbia a mesma célula pode ser expressa pelos dois tipos de geocódigo:

  • Grade de 1 Km da OSMcodes-Logistica de Tunja, CO-15001~K
    onde "15001" é o código postal do município Tunja. Para habitantes de Tunja, por lo tanto o geocódigo tem 1 carácter, "K".
  • Grade de 1 Km da OSMcodes-Cientifica, mesma célula,   CO+c3583v
    ou seja, 6 caracteres na grade científica.
OSMC-explain01.png
A cada nível hierárquico corresponde uma grade.
A Grade Logística do município de Tunja (em amarelo a direita) é um subconjunto da Grade Científica.

Grade e Notação Científica

... por padrão a base16h deve ser adotada. Não há encurtamento por jurisdição (exceto em países onde a convenção dispense uso de reindexação).

Grade e Notação Logística

Faz uso de técnicas de encurtamento do geocódigo:

  • Encurtamento por contexto: prefixos podem ser eliminados quando são conhecidos a priori e uma convenção garante que será subintendido. Por exemplo contexto do país.
  • Prefixo mnemônico: no lugar de geocódigos arbitrários, pode-se fazer uso de abreviações padronizadas e mais fáceis de lembrar. Essa é a principal estratégia. Também proporciona (indiretamente) o encurtamento por contexto jurisdicional. Requer a reindexação do primeiro dígito depois da abreviação.
  • Encurtamento por base maior: quando a base16h não é suficiente, pode-se fazer uso da base32.

A representação interna do geocódigo permanece a mesma, trata-se de um recurso apenas de "renderização" do geocódigo, para que fique mais legível para humanos.

Ver também osmc:Convenções/Coberturas municipais

Demais subconjuntos da Grade Científica

Ver também