DNGS/Decisões soberanas: mudanças entre as edições

De Documentação
(reduzindo para 4 decidoe)
 
(24 revisões intermediárias por 2 usuários não estão sendo mostradas)
Linha 1: Linha 1:
Dentro da '''"Metodologia  OSMCodes para a implantação de novos geocódigos para o país"''', foi concebido um fluxo de decisões a serem tomadas por cada país de forma soberana, sem [[DNGS/Justificativas|risco de colonização digital ou oportunismo de empresas que tornam os usuários reféns dos seus serviços ou patentes]].
Os [[geocódigos]] oficiais de um pais fazem parte da sua [[Infraestrutura Nacional de Dados Espaciais]] (INDE), e esses geocódigos oficiais, para que sejam eficientes e interoperáveis com outros países, devem ser aderentes ao [[Discrete National Grid Systems|padrão DNGS]].


Os [[geocódigos]] oficiais de um pais fazem parte da sua [[Infraestrutura Nacional de Dados Espaciais]] (INDE), e esses geocódigos oficiais, para que sejam eficientes e interoperáveis com outros países, devem ser aderentes ao padrão [[Discrete National Grid Systems|DNGS]]. São de fato requisitos adotados pelo Projeto OSMcodes.
Geocódigos podem ser utilizados nas mais diversas aplicações, atendendo a [[Open Data Index|múltiplas finalidades]]: o mesmo padrão de geocódigos atribuídos a endereços postais, zoneamento censitário, demarcação de terras, e utilizados no intercâmbio e nos mais diversos sistemas de informação geográfica oficiais do país.


[[Arquivo:Osmc-method-reduced.png|miniaturadaimagem|580px|Árvore de decisão para adoção do OSMcodes. Decisões soberanas "D" e ações "A". <br/>Versão simplificada de {{ref|KraEtAll2022a}}.]]
O bom sistema de geocódigos (e respectivo sistema de grades), quando bem usado, se torna parte da cultura do país. Portanto o desenho de um bom geocódigo deve atender às peculiaridades culturais e geográficas do país. O padrão DNGS reconhece essa necessidade e dá liberdade suficiente para o ajuste das peculiaridades sem comprometimento da eficiência nem da interoperabilidade. O ajuste é feito através de decisões: a cada decisão o país opta por uma ou outra dessas "características flexíveis" do geocódigo DNGS.


O projeto [[OSMcodes]] estabeleceu uma série de convenções para a definição de [[wikipedia:geocode|geocódigos]] [[Conhecimento aberto|abertos]] e aderentes à [[Geo URI extendida]], conforme as necessidades ([[Open Data Index|multifinalitárias]]) de cada país. Fazendo uso das convenções e de '''decisões soberanas''', cada país estabelece seu padrão de geocódigo.
Todo país é soberano para ajustar o seu geocódigo, o padrão DNGS portanto oferece uma '''Árvore de decisões soberanas que resultam nas características do geocódigo do país'''.  É o pilar da '''metodologia DNGS''' para a implantação de novos geocódigos, e totalmente isenta de [[DNGS/Justificativas|risco patentes ou fechamento de dados]]. A metodologia é orientada ao país, não aos fornecedores de tecnologia.


As convenções fixadas são resultado de otimização racional, confirmação científica e resultaram em tecnologias livres, isentas de ''copyright'' ou patentes: ver proposta original em {{ref|KraEtAll2022a}}.
[[Arquivo:Osmc-method-reduced.png|miniaturadaimagem|580px|Árvore de decisão para adoção de geocódigos aderentes ao padrão DNGS. Decisões soberanas "D" e ações "A". <br/>Versão simplificada de {{ref|KraEtAll2022a}}.]]


A metodologia OSMcodes parte do pressuposto de que geocódigos-ótimos são possíveis, mas a noção de ótimo vem da comunidade usuária. As comunidades usuárias são as nações, cada uma com sua identidade cultural, peculiaridades e necessidades. É suposto que um padrão nacional é "ótimo" se for baseado na racionalidade (método científico) e na soberania da nação, ou seja, nas decisões tomadas pela própria nação e não por terceiros.
As convenções fixadas são resultado de otimização racional e uso de tecnologias livres, confirmadas científica e jurídicamente: ver proposta original em {{ref|KraEtAll2022a}}.


A seguir cada uma das '''4 decisões soberanas''' na forma de perguntas-respostas, podendo ser referidas "decisão D1", "decisão D2", etc. conforme numeradas as respectivas seções.
A seguir cada uma das '''4 decisões soberanas''', D1, D2, D3 e D4, na forma de "perguntas e respostas".


==Multifinalidade?==
== D1. Multifinalidade?==
A primeira pergunta que a [[Comunidade OSM]], junto com os diversos órgãos oficiais de um país, em particular o [[órgão responsável pelo Censo]] e o [[órgão responsável pelo Correio]] (ou seu regulador), é quanto à '''finalidade do geocódigo nacional''':
Um país tem a liberdade de decidir entre a tecnologia [[GGeohash]] (ver sec.  [[Generalized Geohash/pt#Solução multifinalitária|"solução multifinalitária"]]) e outra qualquer.


*Se for '''orientado apenas a uma aplicação''', então talvez não seja necessária uma solução tão complexa como OSMcodes. O universo de alternativas é muito mais amplo e o conjunto de requisitos muito menor.
Na visão DNGS é suposto que a tecnologia GGeohash é a única que garante geocódigos multifinalitários. Pode-se verificar se são consistentes as justificativas e fundamentos científicos para tal suposição.


*Se for orientado a mais de uma aplicação, que pode ser "'''Correio + Censo'''" ou qualquer outra variação tendo aplicações científicas/computacionais de um lado e logísticas/humanas do outro, então '''o OSMcodes é melhor solução possível para se conciliar todas as aplicações''', tanto aquelas orientadas à grade e como aquelas orientadas ao seu geocódigo.
Sugere-se levar o questionamento para as universidades locais e a [[Comunidade OSM|Comunidade OSM local]], e os mesmos, caso endossem as considerações do DNGS, levariam o questionamento para diversos órgãos oficiais de um país, em particular a [[Infraestrutura Nacional de Dados Espaciais|INDE]], o [[órgão responsável pelo Censo]] e o [[órgão responsável pelo Correio]]. Em conjunto, tomar a decisão quanto à '''finalidade do geocódigo nacional''':


Um importante motivador de aplicações para o OSMcodes é o [[Open Data Index]]: através das várias facetas dos dados que os governos nacionais precisam produzir, percebemos que todos eles se beneficiariam de um geocódigo padrão.  Os requisitos de uma tecnologia de grade (e seu geocódigo) que resulte em interoperabilidade e viabilize multiplas aplicações, são descritos em [[osmc:Requisitos da multifinalidade]].  
*Se for '''orientado apenas a uma aplicação''', então talvez não seja necessária uma solução tão complexa como DNGS. O universo de alternativas é muito mais amplo e o conjunto de requisitos muito menor.


Resumindo: se a opção é pela multifinalidade, seguimos com a metodologia OSMcode, senão a metodologia é "qualquer uma". A adoção do OSMcode se justifica principalmente pelo seu foco na multifinalidade.
*Se for orientado a mais de uma aplicação, que pode ser "'''Correio + Censo'''" ou qualquer outra variação tendo aplicações científicas/computacionais de um lado e logísticas/humanas do outro, então '''o geocódigo DNGS é a melhor solução possível para se conciliar todas as aplicações''', tanto aquelas orientadas à grade e como aquelas orientadas ao seu geocódigo.


==Projeção de igual-área?==
Um importante motivador de aplicações para o ''geocódigo DNGS'' é o [[Open Data Index]]: através das várias facetas dos dados que os governos nacionais precisam produzir, percebemos que todos eles se beneficiariam de um geocódigo padrão.  Os requisitos de uma tecnologia de grade (e seu geocódigo) que resulte em interoperabilidade e viabilize múltiplas aplicações, são descritos nos [[DNGS/Requisitos da multifinalidade|requisitos da multifinalidade do DNGS]].


A [[projeção de igual-área]] é fundamental para o Censo e para todas as demais potenciais aplicações [[DLGS]] do geocódigo e do seu sistema de grades. A adoção desse tipo de projeção é em parte uma consequência natural da decisão por um geocódigo multifinalitário.
Resumindo: se a opção é pela multifinalidade, seguimos com a metodologia DNGS, senão a metodologia é "qualquer uma". A adoção do ''geocódigo DNGS'' se justifica principalmente pelo seu foco na multifinalidade.
 
Quanto à questão "Como o DNGS atende às múltiplas finalidades?", a conclusão científica é que apenas sistemas hierárquicos de grades regulares quadriláteras atendem, sendo aderentes ao padrão DNGS aqueles desenhados como '''[[GGeohash]]'''.
 
== D2. Projeção de igual-área?==
 
A [[projeção de igual-área]] é fundamental para o Censo e para todas as demais potenciais aplicações [[Discrete National Grid Systems/pt|DNGS]] do geocódigo e do seu sistema de grades. A adoção desse tipo de projeção é, em parte, uma consequência natural da decisão por um geocódigo multifinalitário.


Ainda assim, se o leque de aplicações adotado para a visão de multifinalidade do país não envolver aplicações científicas ou estatísticas, o os requisitos destas aplicações não forem tão rígidos, uma projeção de "quase igual-área" (ex. Mercator na região do Equador) pode ser adotada. Quanto menor a aderência a aplicações científicas, menor a demanda por igual-área, podendo inclusive adotar o não-uso de projeção, como nos padrões Geohash e OLC.  
Ainda assim, se o leque de aplicações adotado para a visão de multifinalidade do país não envolver aplicações científicas ou estatísticas, o os requisitos destas aplicações não forem tão rígidos, uma projeção de "quase igual-área" (ex. Mercator na região do Equador) pode ser adotada. Quanto menor a aderência a aplicações científicas, menor a demanda por igual-área, podendo inclusive adotar o não-uso de projeção, como nos padrões Geohash e OLC.  


A tabela do [[Open Data Index]] indica as aplicações e seus requisitos. A seguir as '''decisões soberanas''' na forma de perguntas, podendo ser numeradas na ordem apresentada, D1, D2, D3, etc.  
A tabela do [[Open Data Index]] indica as aplicações com demanda por dados abertos, e seus requisitos. Para todas elas, a grade é, do ponto de vista tecnológico e científico, o meio mais adequado para a publicação de dados governamentais.
 
Principais exemplos: censo (densidade populacional, de domicílios ocupados etc.); eleições (distribuição de votos); meteorológicos (temperatura média, insolação média, pluviometria etc.); emergências (distribuição nas pandemias, incêndios etc.); ambientais (qualidade de água, do ar, índice vegetação etc); distribuição  orçamentária, jurisdições, propriedade da terra, e outros. Em todas essas aplicações governamentais, conforme já se demonstrou amplamente para o padrão [[DGGS]] e nas [[INDE]]s, a grade padrão do país torna os dados interoperáveis, simples de se analisar e baratos de se processar.
 
=== D2.1. Eixos das coordenadas de referência ===
A decisão seguinte à projeção é com relação à definição precisa de qual território incluir dentro do sistema de grades. Com ou sem [[wikipedia:Territorial waters|mar territorial]]? Com ou sem  [[wikipedia:Exclusive economic zone|Zona econômica exclusiva]]? Com qual [[wikipedia:Buffer analysis|''buffer'' de segurança]] nas delimitações atuais do território terrestre e divisas com outros países?
 
[[Arquivo:XY-origin-illustrating1.png|miniaturadaimagem|200px|Escolha oficial da origem XY.]]


==Área territorial pequena?==
São todas decisões soberanas, e que impactam na escolha final de um sistema de coordenadas otimizado para a nação. A origem dos eixos XY desse sistema será eleita em conformidade com essas decisões. Em seguida o tamanho da box também um padrão nacional, pois vai definir os identificadores de grade.
 
=== D2.2. Ajuste da Cobertura L0 ===
 
Apesar das decisões tomadas (projeção, origem e polígono nacional) e das convenções DNGS para se fixar um máximo de 16 células de cobertura territorial definidoras da grade nacional, essas células do nível ''L0'' estão sujeitas a ajustes menores, não resolvidos pelas convenções. Eles se devem principalmente ao erro de delimitação das bordas (e sua variação),  às decisões por reserva (caso a nação esteja sujeita a mudanças territoriais maiores) e às decisões de desmembramento. Ver [[osmc:Metodologia#Indexação_L0|Indexação L0 na Metodologia DNGS]].
 
== D3a. Área territorial pequena?==
[[Arquivo:AmericaSul.png|miniaturadaimagem|Suriname e Guiana Francesa são exemplos de países com área "pequena o suficiente" para usar apenas ''base16h''.]]
[[Arquivo:AmericaSul.png|miniaturadaimagem|Suriname e Guiana Francesa são exemplos de países com área "pequena o suficiente" para usar apenas ''base16h''.]]


Países com área territorial maior, como Brasil e Colômbia, requerem o máximo de compactação no geocódigo logístico para
Países com área territorial maior, como Brasil e Colômbia, requerem o máximo de compactação no geocódigo logístico para
que seus usuários consigam memorizar facilmente. Países menores do que o Uruguai não se beneficiam tanto de compactação da [[base32]], conseguindo
que seus usuários consigam memorizar facilmente. Países menores do que o Uruguai não se beneficiam tanto de compactação da [[base32]], conseguindo resultados similares com a [[base16h]], podendo portanto usar o
resultados similares com a [[base16h]], podendo portanto usar o
mesmo geocódigo nas aplicações postais e científicas.
mesmo geocódigo nas aplicações postais e científicas.


===Base32 NVU no geocódigo logístico? ===
=== D3b. Base32 NVU no geocódigo logístico? ===
Países maiores
Países maiores, que tomaram a ''decisão D3'' "não", fazem uso dos geocódigos de notação logística diferenciada, na base32 ao invés da base16h.  
Países , que efetivamente tomaram a ''decisão D3'' "não", fazem uso dos geocódigos de notação logística diferenciada, na base32 ao invés da base16h.  


Nesse caso, conforme alfabeto oficial e cultura (preocupação em não confundir geocódigos com palavras), países de língua escrita não-latina (ex. coreano) podem adotar, em lugar do alfabeto ''base32nvu'' (ver "''N''o ''V''ogal except ''U''" nas [[Geohash generalizado#Representação textual|opções de representação textual no Geohash Generalizado]]), outro alfabeto de sua escolha. Mesmo a ''base16h'', supostamente universal por ser extensão dos hexadecimais, pode fazer uso de letras mais apropriadas, caso desejado.
Nesse caso, conforme alfabeto oficial e cultura (preocupação em não confundir geocódigos com palavras), países de língua escrita não-latina (ex. coreano) podem adotar, em lugar do alfabeto ''base32nvu'' (ver "''N''o ''V''ogal except ''U''" nas [[Geohash generalizado#Representação textual|opções de representação textual no Geohash Generalizado]]), outro alfabeto de sua escolha. Mesmo a ''[[base16h]]'', supostamente universal por ser extensão dos hexadecimais, pode fazer uso de letras mais apropriadas, caso desejado.


Exemplo com letras dos alfabetos [[Wikipedia:Russian alphabet|russo]] e [[wikipedia:Hangul_orthography|Hangul coreano]], evitando ambiguidades e usando sequências validas para ambos, sul e norte-coreano:
Exemplo com letras dos alfabetos [[Wikipedia:Russian alphabet|russo]] e [[wikipedia:Hangul_orthography|Hangul coreano]], evitando ambiguidades e usando sequências válidas:
{| class="wikitable"
{| class="wikitable"
|+
|+
Linha 65: Linha 82:
|...
|...
|}
|}
=== D3b2. Coberturas logísticas uniformes? ===
Outro impacto da utilização da base32 vem do fato de ser um subconjunto muito menor de grades, com menos níveis:


==Intervalos de geocódigos?==
* Coberturas municipais uniformes: apenas base 32 válidas. Garante a compatibilidade de células entre municípios, todos com mesmo tamanho, e todos chegando até o metro.
 
* Coberturas municipais livres: perde a compatibilidade, ganha poder de cobertura (dispensa ou reduz uso de [[osmc:Convenções/Coberturas_municipais#Cobertura-overlay|overlay]]).
 
== D4. Intervalos de geocódigos?==


[[Arquivo:Sfc4q-intervals-comparing1.png|miniaturadaimagem|480px|Comportamento do intervalo 7 a 9. Na Curva de Morton há descontinuidade.]]
[[Arquivo:Sfc4q-intervals-comparing1.png|miniaturadaimagem|480px|Comportamento do intervalo 7 a 9. Na Curva de Morton há descontinuidade.]]


[[Arquivo:Sfc4q-intervals-Z-problem2.png|miniaturadaimagem|480px|Intervalos 4-10 (verde), 28-34 (lilás) e 55-58 (azul), mostrando o crescente de interrupções na Curva de Morton conforme se avança no tamanho da grade. Os intervalos são sempre contíguos em Hilbert.]]
[[Arquivo:Sfc4q-intervals-Z-problem2.png|miniaturadaimagem|480px|Intervalos 4-9 (verde), 28-34 (lilás) e 55-58 (azul), mostrando o crescente de interrupções na Curva de Morton conforme se avança no tamanho da grade. Os intervalos são sempre contíguos em Hilbert.]]


Em computação o balanceamento de cargas
Quando associamos as células de uma grade a uma grandeza, tal como população, podemos escolher conjuntos de células contíguas que proporcionem uma distribuição uniforme da grandeza. Os conjuntos podem ser identificados de duas forma:
entre partições de disco requer a escolha de geocódigos de diferentes
grades da hierarquia, mas uma segunda estratégia é a escolha de
intervalos de geocódigos de uma mesma grade. Outras aplicações, tais
como definição de setores territoriais na gestão pública, podem também
fazer uso de intervalos. O demanda ou não por intervalos contínuos
determina qual indexação utilizar, tipicamente a escolha entre “Curva Z”
de Morton e “Curva U” de Hilbert.


Intervalos podem ser úteis para definir zonas abstratas (não-políticas) coerentes com a indexação e ao mesmo tempo uma grandeza para estabelecer partições balanceadas, por exemplo a população dentro do intervalo:
# Pelo geocódigo da célula-mãe:  geocódigo resultante do prefixo comum das células do conjunto.
*na administração pública:
# Por um intervalo de geocódigos de células vizinhas: dois geocódigos, da primeira e da última célula do intervalo.
**o tradicional '''roteamento postal''', objetivo maior dos códigos postais nas décadas de 1970 a 1990. Hoje com com softwares eficientes de roteamento o intervalo se prestaria à definição arbitrária de setores de distribuições.
**definição de '''zonas administrativas''' ou jurisdição equilibradas: zonas de responsabilidade de cartórios, de tribunais ou responsabilidade fiscal.
*nas redes e computadores:
** '''partições em disco ou rede''', para agregar dados relativos a uma mesma vizinhança: alternativa ao "agregar pela célula mãe", pode trazer mais flexibilidade às estratégias de partição, consequentemente maior otimização.
**na '''visualização e estatística''' de dados espaciais:  intervalos contínuos garantem consistência estatística, por exemplo para associação em histogramas.


==Liberdade parcial para outras decisões==
A segunda forma, além de poder ser usada com a primeira, proporciona maior flexibilidade, portanto garantia maior de balanceamento. No exemplo, a garantia de que a soma da população resultante em diferentes intervalos terá aproximadamente a mesma. Por conterem todos aproximadamente o mesmo valor total da grandeza distribuída pelas suas células, dizemos que são ''partições''. Fisicamente cada partição estará armazenada em um mesmo arquivo [[Apache_Parquet#Partição|Parquet]] ou [[GeoJSON#Partição_em_git|GeoJSON]].


A proposta do padrão é que seja, dentro do possível, o mais parecido e interoperável para os diversos países que vierem a adotá-lo. Daí serem apenas 5 alternativas: quanto maior o número de alternativas, mais difícil elas resultarem em um todo interoperável. Todavia, como algumas alternativas não afetam tanto a interoperabilidade, e como por se tratarem de decisões soberanas, ficam em aberto.  
Uma aplicação importante em computação é a distribuição equilibrada do consumo de disco (volume em bytes) pelas partições. A escolha adequada dos intervalos resulta em um bom ''balanceamento de carga'' entre as partições. Em uma tabela de pontos de endereço, por exemplo, podemos esperar que a quantidade de pontos por partição será aproximadamente a mesma. Como o registro de cada ponto consome uma quantidade fixa de bytes, temos também um bom balanceamento de carga.


Da experiência com a implantação em diferentes países, foi percebida principalmente a demanda por compatibilidade com padrões antigos.  '''Não recomendamos o compromisso com legados''', pois em geral a cobertura legada não é relevante, e a compatibilidade conquistada é parcial. A perda de compatibilidade com o OSMcodes de outros países acaba sendo muito mais prejudicial do que o ganho com legados. A seguir os dois principais exemplos.
Outras aplicações, tais como definição de setores territoriais na gestão pública, podem também fazer uso de intervalos.
 
'''Decisão''' soberana, na escolha entre os dois métodos de indexação: “Curva&nbsp;Z” de Morton, ruim para intervalos (mas boa em performance); e “Curva&nbsp;U” de Hilbert, boa para intervalos. A&nbsp;demanda ou&nbsp;não por intervalos contínuos nas aplicações priorizadas pelo país determina qual indexação utilizar.
 
'''Resumo''' das motivações da escolha, respondendo à  pergunta ''"o país precisa ou não precisa de intervalos mais coerentes?"''. Intervalos podem ser úteis para definir zonas contíguas coerentes com a indexação e com a distribuição uniforme de uma grandeza, estabelecendo partições balanceadas:
 
* na administração pública:
** o tradicional '''roteamento postal''', balanceando o número de endereços por partição. Objetivo maior dos códigos postais nas décadas de 1970 a 1990. Hoje com com softwares eficientes de roteamento o intervalo se prestaria à definição arbitrária de setores de distribuições.
** definição de '''zonas administrativas''' ou jurisdição equilibradas: zonas de responsabilidade de cartórios, de tribunais ou responsabilidade fiscal. Balanceadas por gradezas como ''população'' ou ''volume de trabalho''.
 
* na infraestrutura (redes de computadores) e internamente nos bancos de dados:
** '''partições em disco ou rede''', para agregar dados relativos a uma mesma vizinhança espacial.
** na '''visualização e estatística''' de dados espaciais:  intervalos contínuos garantem consistência estatística, por exemplo para associação em histogramas.
 
== Liberdade parcial para outras decisões ==
 
A proposta do padrão DNGS é que seja, dentro do possível, o mais parecido e interoperável para os diversos países que vierem a adotá-lo. Daí serem apenas 5 alternativas: quanto maior o número de alternativas, mais difícil elas resultarem em um todo interoperável. Todavia, como algumas alternativas não afetam tanto a interoperabilidade, e como por se tratarem de decisões soberanas, ficam em aberto.
 
Da experiência com a implantação em diferentes países, foi percebida principalmente a demanda por compatibilidade com padrões antigos.  '''Não recomendamos o compromisso com legados''', pois em geral a cobertura legada não é relevante, e a compatibilidade conquistada é parcial. A perda de compatibilidade com o ''geocódigo DNGS'' de outros países acaba sendo muito mais prejudicial do que o ganho com legados. A seguir os dois principais exemplos.


'''Compromisso com grades legadas?'''
'''Compromisso com grades legadas?'''
Linha 101: Linha 130:
'''Compromisso com cobertura legada?'''
'''Compromisso com cobertura legada?'''
: No caso do Brasil já existia uma articulação de quadrantes passível de adaptação, no caso da Colômbia nenhuma sugestão oficial. A decisão pode impactar no acréscimo de mais um dígito ao geocódigo absoluto, mas não no curto.
: No caso do Brasil já existia uma articulação de quadrantes passível de adaptação, no caso da Colômbia nenhuma sugestão oficial. A decisão pode impactar no acréscimo de mais um dígito ao geocódigo absoluto, mas não no curto.
 
[[Categoria:Discrete National Grid Systems]]
[[Categoria:OSMcodes]]

Edição atual tal como às 07h21min de 13 de junho de 2024

Os geocódigos oficiais de um pais fazem parte da sua Infraestrutura Nacional de Dados Espaciais (INDE), e esses geocódigos oficiais, para que sejam eficientes e interoperáveis com outros países, devem ser aderentes ao padrão DNGS.

Geocódigos podem ser utilizados nas mais diversas aplicações, atendendo a múltiplas finalidades: o mesmo padrão de geocódigos atribuídos a endereços postais, zoneamento censitário, demarcação de terras, e utilizados no intercâmbio e nos mais diversos sistemas de informação geográfica oficiais do país.

O bom sistema de geocódigos (e respectivo sistema de grades), quando bem usado, se torna parte da cultura do país. Portanto o desenho de um bom geocódigo deve atender às peculiaridades culturais e geográficas do país. O padrão DNGS reconhece essa necessidade e dá liberdade suficiente para o ajuste das peculiaridades sem comprometimento da eficiência nem da interoperabilidade. O ajuste é feito através de decisões: a cada decisão o país opta por uma ou outra dessas "características flexíveis" do geocódigo DNGS.

Todo país é soberano para ajustar o seu geocódigo, o padrão DNGS portanto oferece uma Árvore de decisões soberanas que resultam nas características do geocódigo do país. É o pilar da metodologia DNGS para a implantação de novos geocódigos, e totalmente isenta de risco patentes ou fechamento de dados. A metodologia é orientada ao país, não aos fornecedores de tecnologia.

Árvore de decisão para adoção de geocódigos aderentes ao padrão DNGS. Decisões soberanas "D" e ações "A".
Versão simplificada de [KraEtAll2022a].

As convenções fixadas são resultado de otimização racional e uso de tecnologias livres, confirmadas científica e jurídicamente: ver proposta original em [KraEtAll2022a].

A seguir cada uma das 4 decisões soberanas, D1, D2, D3 e D4, na forma de "perguntas e respostas".

D1. Multifinalidade?

Um país tem a liberdade de decidir entre a tecnologia GGeohash (ver sec. "solução multifinalitária") e outra qualquer.

Na visão DNGS é suposto que a tecnologia GGeohash é a única que garante geocódigos multifinalitários. Pode-se verificar se são consistentes as justificativas e fundamentos científicos para tal suposição.

Sugere-se levar o questionamento para as universidades locais e a Comunidade OSM local, e os mesmos, caso endossem as considerações do DNGS, levariam o questionamento para diversos órgãos oficiais de um país, em particular a INDE, o órgão responsável pelo Censo e o órgão responsável pelo Correio. Em conjunto, tomar a decisão quanto à finalidade do geocódigo nacional:

  • Se for orientado apenas a uma aplicação, então talvez não seja necessária uma solução tão complexa como DNGS. O universo de alternativas é muito mais amplo e o conjunto de requisitos muito menor.
  • Se for orientado a mais de uma aplicação, que pode ser "Correio + Censo" ou qualquer outra variação tendo aplicações científicas/computacionais de um lado e logísticas/humanas do outro, então o geocódigo DNGS é a melhor solução possível para se conciliar todas as aplicações, tanto aquelas orientadas à grade e como aquelas orientadas ao seu geocódigo.

Um importante motivador de aplicações para o geocódigo DNGS é o Open Data Index: através das várias facetas dos dados que os governos nacionais precisam produzir, percebemos que todos eles se beneficiariam de um geocódigo padrão. Os requisitos de uma tecnologia de grade (e seu geocódigo) que resulte em interoperabilidade e viabilize múltiplas aplicações, são descritos nos requisitos da multifinalidade do DNGS.

Resumindo: se a opção é pela multifinalidade, seguimos com a metodologia DNGS, senão a metodologia é "qualquer uma". A adoção do geocódigo DNGS se justifica principalmente pelo seu foco na multifinalidade.

Quanto à questão "Como o DNGS atende às múltiplas finalidades?", a conclusão científica é que apenas sistemas hierárquicos de grades regulares quadriláteras atendem, sendo aderentes ao padrão DNGS aqueles desenhados como GGeohash.

D2. Projeção de igual-área?

A projeção de igual-área é fundamental para o Censo e para todas as demais potenciais aplicações DNGS do geocódigo e do seu sistema de grades. A adoção desse tipo de projeção é, em parte, uma consequência natural da decisão por um geocódigo multifinalitário.

Ainda assim, se o leque de aplicações adotado para a visão de multifinalidade do país não envolver aplicações científicas ou estatísticas, o os requisitos destas aplicações não forem tão rígidos, uma projeção de "quase igual-área" (ex. Mercator na região do Equador) pode ser adotada. Quanto menor a aderência a aplicações científicas, menor a demanda por igual-área, podendo inclusive adotar o não-uso de projeção, como nos padrões Geohash e OLC.

A tabela do Open Data Index indica as aplicações com demanda por dados abertos, e seus requisitos. Para todas elas, a grade é, do ponto de vista tecnológico e científico, o meio mais adequado para a publicação de dados governamentais.

Principais exemplos: censo (densidade populacional, de domicílios ocupados etc.); eleições (distribuição de votos); meteorológicos (temperatura média, insolação média, pluviometria etc.); emergências (distribuição nas pandemias, incêndios etc.); ambientais (qualidade de água, do ar, índice vegetação etc); distribuição orçamentária, jurisdições, propriedade da terra, e outros. Em todas essas aplicações governamentais, conforme já se demonstrou amplamente para o padrão DGGS e nas INDEs, a grade padrão do país torna os dados interoperáveis, simples de se analisar e baratos de se processar.

D2.1. Eixos das coordenadas de referência

A decisão seguinte à projeção é com relação à definição precisa de qual território incluir dentro do sistema de grades. Com ou sem mar territorial? Com ou sem Zona econômica exclusiva? Com qual buffer de segurança nas delimitações atuais do território terrestre e divisas com outros países?

Escolha oficial da origem XY.

São todas decisões soberanas, e que impactam na escolha final de um sistema de coordenadas otimizado para a nação. A origem dos eixos XY desse sistema será eleita em conformidade com essas decisões. Em seguida o tamanho da box também um padrão nacional, pois vai definir os identificadores de grade.

D2.2. Ajuste da Cobertura L0

Apesar das decisões tomadas (projeção, origem e polígono nacional) e das convenções DNGS para se fixar um máximo de 16 células de cobertura territorial definidoras da grade nacional, essas células do nível L0 estão sujeitas a ajustes menores, não resolvidos pelas convenções. Eles se devem principalmente ao erro de delimitação das bordas (e sua variação), às decisões por reserva (caso a nação esteja sujeita a mudanças territoriais maiores) e às decisões de desmembramento. Ver Indexação L0 na Metodologia DNGS.

D3a. Área territorial pequena?

Suriname e Guiana Francesa são exemplos de países com área "pequena o suficiente" para usar apenas base16h.

Países com área territorial maior, como Brasil e Colômbia, requerem o máximo de compactação no geocódigo logístico para que seus usuários consigam memorizar facilmente. Países menores do que o Uruguai não se beneficiam tanto de compactação da base32, conseguindo resultados similares com a base16h, podendo portanto usar o mesmo geocódigo nas aplicações postais e científicas.

D3b. Base32 NVU no geocódigo logístico?

Países maiores, que tomaram a decisão D3 "não", fazem uso dos geocódigos de notação logística diferenciada, na base32 ao invés da base16h.

Nesse caso, conforme alfabeto oficial e cultura (preocupação em não confundir geocódigos com palavras), países de língua escrita não-latina (ex. coreano) podem adotar, em lugar do alfabeto base32nvu (ver "No Vogal except U" nas opções de representação textual no Geohash Generalizado), outro alfabeto de sua escolha. Mesmo a base16h, supostamente universal por ser extensão dos hexadecimais, pode fazer uso de letras mais apropriadas, caso desejado.

Exemplo com letras dos alfabetos russo e Hangul coreano, evitando ambiguidades e usando sequências válidas:

Base32 Base16h
Latino 0123456789BCDFGHJKLMNPQRSTUVWXYZ 0123456789abcdef GQ HMRV JKNPSTZY
Coreano 0123456789ㄱㄴㄷㅁㅂㅅㅈㅊㅋㅌㅎㅏㅑㅓㅕ... 0123456789ㄱㄴㄷㅁㅂㅅ ㅏㅑ ㅓㅕ.. ...
Russo 012345789бвгджзйклмнпpcтфxцш ...

D3b2. Coberturas logísticas uniformes?

Outro impacto da utilização da base32 vem do fato de ser um subconjunto muito menor de grades, com menos níveis:

  • Coberturas municipais uniformes: apenas base 32 válidas. Garante a compatibilidade de células entre municípios, todos com mesmo tamanho, e todos chegando até o metro.
  • Coberturas municipais livres: perde a compatibilidade, ganha poder de cobertura (dispensa ou reduz uso de overlay).

D4. Intervalos de geocódigos?

Comportamento do intervalo 7 a 9. Na Curva de Morton há descontinuidade.
Intervalos 4-9 (verde), 28-34 (lilás) e 55-58 (azul), mostrando o crescente de interrupções na Curva de Morton conforme se avança no tamanho da grade. Os intervalos são sempre contíguos em Hilbert.

Quando associamos as células de uma grade a uma grandeza, tal como população, podemos escolher conjuntos de células contíguas que proporcionem uma distribuição uniforme da grandeza. Os conjuntos podem ser identificados de duas forma:

  1. Pelo geocódigo da célula-mãe: geocódigo resultante do prefixo comum das células do conjunto.
  2. Por um intervalo de geocódigos de células vizinhas: dois geocódigos, da primeira e da última célula do intervalo.

A segunda forma, além de poder ser usada com a primeira, proporciona maior flexibilidade, portanto garantia maior de balanceamento. No exemplo, a garantia de que a soma da população resultante em diferentes intervalos terá aproximadamente a mesma. Por conterem todos aproximadamente o mesmo valor total da grandeza distribuída pelas suas células, dizemos que são partições. Fisicamente cada partição estará armazenada em um mesmo arquivo Parquet ou GeoJSON.

Uma aplicação importante em computação é a distribuição equilibrada do consumo de disco (volume em bytes) pelas partições. A escolha adequada dos intervalos resulta em um bom balanceamento de carga entre as partições. Em uma tabela de pontos de endereço, por exemplo, podemos esperar que a quantidade de pontos por partição será aproximadamente a mesma. Como o registro de cada ponto consome uma quantidade fixa de bytes, temos também um bom balanceamento de carga.

Outras aplicações, tais como definição de setores territoriais na gestão pública, podem também fazer uso de intervalos.

Decisão soberana, na escolha entre os dois métodos de indexação: “Curva Z” de Morton, ruim para intervalos (mas boa em performance); e “Curva U” de Hilbert, boa para intervalos. A demanda ou não por intervalos contínuos nas aplicações priorizadas pelo país determina qual indexação utilizar.

Resumo das motivações da escolha, respondendo à pergunta "o país precisa ou não precisa de intervalos mais coerentes?". Intervalos podem ser úteis para definir zonas contíguas coerentes com a indexação e com a distribuição uniforme de uma grandeza, estabelecendo partições balanceadas:

  • na administração pública:
    • o tradicional roteamento postal, balanceando o número de endereços por partição. Objetivo maior dos códigos postais nas décadas de 1970 a 1990. Hoje com com softwares eficientes de roteamento o intervalo se prestaria à definição arbitrária de setores de distribuições.
    • definição de zonas administrativas ou jurisdição equilibradas: zonas de responsabilidade de cartórios, de tribunais ou responsabilidade fiscal. Balanceadas por gradezas como população ou volume de trabalho.
  • na infraestrutura (redes de computadores) e internamente nos bancos de dados:
    • partições em disco ou rede, para agregar dados relativos a uma mesma vizinhança espacial.
    • na visualização e estatística de dados espaciais: intervalos contínuos garantem consistência estatística, por exemplo para associação em histogramas.

Liberdade parcial para outras decisões

A proposta do padrão DNGS é que seja, dentro do possível, o mais parecido e interoperável para os diversos países que vierem a adotá-lo. Daí serem apenas 5 alternativas: quanto maior o número de alternativas, mais difícil elas resultarem em um todo interoperável. Todavia, como algumas alternativas não afetam tanto a interoperabilidade, e como por se tratarem de decisões soberanas, ficam em aberto.

Da experiência com a implantação em diferentes países, foi percebida principalmente a demanda por compatibilidade com padrões antigos. Não recomendamos o compromisso com legados, pois em geral a cobertura legada não é relevante, e a compatibilidade conquistada é parcial. A perda de compatibilidade com o geocódigo DNGS de outros países acaba sendo muito mais prejudicial do que o ganho com legados. A seguir os dois principais exemplos.

Compromisso com grades legadas?

Tipicamente as grades com quadrados de 1 km de lado são solicitadas como padrão para o intercâmbio e comparação internacionais. O uso da grade de 1024 metros todavia costuma ser aceito para esse tipo de demanda.

Compromisso com cobertura legada?

No caso do Brasil já existia uma articulação de quadrantes passível de adaptação, no caso da Colômbia nenhuma sugestão oficial. A decisão pode impactar no acréscimo de mais um dígito ao geocódigo absoluto, mas não no curto.