DNGS/Decisões soberanas

De Documentação
< DNGS
Revisão de 21h14min de 12 de junho de 2024 por Peter (discussão | contribs) (revisao de texto)

Os geocódigos oficiais de um pais fazem parte da sua Infraestrutura Nacional de Dados Espaciais (INDE), e esses geocódigos oficiais, para que sejam eficientes e interoperáveis com outros países, devem ser aderentes ao padrão DNGS.

Geocódigos podem ser utilizados nas mais diversas aplicações, atendendo a múltiplas finalidades: o mesmo padrão de geocódigos atribuídos a endereços postais, zoneamento censitário, demarcação de terras, e utilizados no intercâmbio e nos mais diversos sistemas de informação geográfica oficiais do país.

O bom sistema de geocódigos (e respectivo sistema de grades), quando bem usado, se torna parte da cultura do país. Portanto o desenho de um bom geocódigo deve atender às peculiaridades culturais e geográficas do país. O padrão DNGS reconhece essa necessidade e dá liberdade suficiente para o ajuste das peculiaridades sem comprometimento da eficiência nem da interoperabilidade. O ajuste é feito através de decisões: a cada decisão o país opta por uma ou outra dessas "características flexíveis" do geocódigo DNGS.

Todo país é soberano para ajustar o seu geocódigo, o padrão DNGS portanto oferece uma Árvore de decisões soberanas que resultam nas características do geocódigo do país. É o pilar da metodologia DNGS para a implantação de novos geocódigos, e totalmente isenta de risco patentes ou fechamento de dados. A metodologia é orientada ao país, não aos fornecedores de tecnologia.

Árvore de decisão para adoção de geocódigos aderentes ao padrão DNGS. Decisões soberanas "D" e ações "A".
Versão simplificada de [KraEtAll2022a].

As convenções fixadas são resultado de otimização racional e uso de tecnologias livres, confirmadas científica e jurídicamente: ver proposta original em [KraEtAll2022a].

A seguir cada uma das 4 decisões soberanas, D1, D2, D3 e D4, na forma de "perguntas e respostas".

D1. Multifinalidade?

Um país tem a liberdade de decidir entre a tecnologia GGeohash (ver sec. "solução multifinalitária") e outra qualquer.

Na visão DNGS é suposto que a tecnologia GGeohash é a única que garante geocódigos multifinalitários. Pode-se verificar se são consistentes as justificativas e fundamentos científicos para tal suposição.

Sugere-se levar o questionamento para as universidades locais e a Comunidade OSM local, e os mesmos, caso endossem as considerações do DNGS, levariam o questionamento para diversos órgãos oficiais de um país, em particular a INDE, o órgão responsável pelo Censo e o órgão responsável pelo Correio. Em conjunto, tomar a decisão quanto à finalidade do geocódigo nacional:

  • Se for orientado apenas a uma aplicação, então talvez não seja necessária uma solução tão complexa como DNGS. O universo de alternativas é muito mais amplo e o conjunto de requisitos muito menor.
  • Se for orientado a mais de uma aplicação, que pode ser "Correio + Censo" ou qualquer outra variação tendo aplicações científicas/computacionais de um lado e logísticas/humanas do outro, então o geocódigo DNGS é a melhor solução possível para se conciliar todas as aplicações, tanto aquelas orientadas à grade e como aquelas orientadas ao seu geocódigo.

Um importante motivador de aplicações para o geocódigo DNGS é o Open Data Index: através das várias facetas dos dados que os governos nacionais precisam produzir, percebemos que todos eles se beneficiariam de um geocódigo padrão. Os requisitos de uma tecnologia de grade (e seu geocódigo) que resulte em interoperabilidade e viabilize múltiplas aplicações, são descritos nos requisitos da multifinalidade do DNGS.

Resumindo: se a opção é pela multifinalidade, seguimos com a metodologia DNGS, senão a metodologia é "qualquer uma". A adoção do geocódigo DNGS se justifica principalmente pelo seu foco na multifinalidade.

Quanto à questão "Como o DNGS atende às múltiplas finalidades?", a conclusão científica é que apenas sistemas hierárquicos de grades regulares quadriláteras atendem, sendo aderentes ao padrão DNGS aqueles desenhados como GGeohash.

D2. Projeção de igual-área?

A projeção de igual-área é fundamental para o Censo e para todas as demais potenciais aplicações DNGS do geocódigo e do seu sistema de grades. A adoção desse tipo de projeção é, em parte, uma consequência natural da decisão por um geocódigo multifinalitário.

Ainda assim, se o leque de aplicações adotado para a visão de multifinalidade do país não envolver aplicações científicas ou estatísticas, o os requisitos destas aplicações não forem tão rígidos, uma projeção de "quase igual-área" (ex. Mercator na região do Equador) pode ser adotada. Quanto menor a aderência a aplicações científicas, menor a demanda por igual-área, podendo inclusive adotar o não-uso de projeção, como nos padrões Geohash e OLC.

A tabela do Open Data Index indica as aplicações com demanda por dados abertos, e seus requisitos. Para todas elas, a grade é, do ponto de vista tecnológico e científico, o meio mais adequado para a publicação de dados governamentais.

Principais exemplos: censo (densidade populacional, de domicílios ocupados etc.); eleições (distribuição de votos); meteorológicos (temperatura média, insolação média, pluviometria etc.); emergências (distribuição nas pandemias, incêndios etc.); ambientais (qualidade de água, do ar, índice vegetação etc); distribuição orçamentária, jurisdições, propriedade da terra, e outros. Em todas essas aplicações governamentais, conforme já se demonstrou amplamente para o padrão DGGS e nas INDEs, a grade padrão do país torna os dados interoperáveis, simples de se analisar e baratos de se processar.

D2.1. Eixos das coordenadas de referência

A decisão seguinte à projeção é com relação à definição precisa de qual território incluir dentro do sistema de grades. Com ou sem mar territorial? Com ou sem Zona econômica exclusiva? Com qual buffer de segurança nas delimitações atuais do território terrestre e divisas com outros países?

Escolha oficial da origem XY.

São todas decisões soberanas, e que impactam na escolha final de um sistema de coordenadas otimizado para a nação. A origem dos eixos XY desse sistema será eleita em conformidade com essas decisões. Em seguida o tamanho da box também um padrão nacional, pois vai definir os identificadores de grade.

D3a. Área territorial pequena?

Suriname e Guiana Francesa são exemplos de países com área "pequena o suficiente" para usar apenas base16h.

Países com área territorial maior, como Brasil e Colômbia, requerem o máximo de compactação no geocódigo logístico para que seus usuários consigam memorizar facilmente. Países menores do que o Uruguai não se beneficiam tanto de compactação da base32, conseguindo resultados similares com a base16h, podendo portanto usar o mesmo geocódigo nas aplicações postais e científicas.

D3b. Base32 NVU no geocódigo logístico?

Países maiores, que tomaram a decisão D3 "não", fazem uso dos geocódigos de notação logística diferenciada, na base32 ao invés da base16h.

Nesse caso, conforme alfabeto oficial e cultura (preocupação em não confundir geocódigos com palavras), países de língua escrita não-latina (ex. coreano) podem adotar, em lugar do alfabeto base32nvu (ver "No Vogal except U" nas opções de representação textual no Geohash Generalizado), outro alfabeto de sua escolha. Mesmo a base16h, supostamente universal por ser extensão dos hexadecimais, pode fazer uso de letras mais apropriadas, caso desejado.

Exemplo com letras dos alfabetos russo e Hangul coreano, evitando ambiguidades e usando sequências válidas:

Base32 Base16h
Latino 0123456789BCDFGHJKLMNPQRSTUVWXYZ 0123456789abcdef GQ HMRV JKNPSTZY
Coreano 0123456789ㄱㄴㄷㅁㅂㅅㅈㅊㅋㅌㅎㅏㅑㅓㅕ... 0123456789ㄱㄴㄷㅁㅂㅅ ㅏㅑ ㅓㅕ.. ...
Russo 012345789бвгджзйклмнпpcтфxцш ...

D3b2. Coberturas logísticas uniformes?

Outro impacto da utilização da base32 vem do fato de ser um subconjunto muito menor de grades, com menos níveis:

  • Coberturas municipais uniformes: apenas base 32 válidas. Garante a compatibilidade de células entre municípios, todos com mesmo tamanho, e todos chegando até o metro.
  • Coberturas municipais livres: perde a compatibilidade, ganha poder de cobertura (dispensa ou reduz uso de overlay).

D4. Intervalos de geocódigos?

Comportamento do intervalo 7 a 9. Na Curva de Morton há descontinuidade.
Intervalos 4-9 (verde), 28-34 (lilás) e 55-58 (azul), mostrando o crescente de interrupções na Curva de Morton conforme se avança no tamanho da grade. Os intervalos são sempre contíguos em Hilbert.

Quando associamos as células de uma grade a uma grandeza, tal como população, podemos escolher conjuntos de células contíguas que proporcionem uma distribuição uniforme da grandeza. Os conjuntos podem ser identificados de duas forma:

  1. Pelo geocódigo da célula-mãe: geocódigo resultante do prefixo comum das células do conjunto.
  2. Por um intervalo de geocódigos de células vizinhas: dois geocódigos, da primeira e da última célula do intervalo.

A segunda forma, além de poder ser usada com a primeira, proporciona maior flexibilidade, portanto garantia maior de balanceamento. No exemplo, a garantia de que a soma da população resultante em diferentes intervalos terá aproximadamente a mesma. Por conterem todos aproximadamente o mesmo valor total da grandeza distribuída pelas suas células, dizemos que são partições. Fisicamente cada partição estará armazenada em um mesmo arquivo Parquet ou GeoJSON.

Uma aplicação importante em computação é a distribuição equilibrada do consumo de disco (volume em bytes) pelas partições. A escolha adequada dos intervalos resulta em um bom balanceamento de carga entre as partições. Em uma tabela de pontos de endereço, por exemplo, podemos esperar que a quantidade de pontos por partição será aproximadamente a mesma. Como o registro de cada ponto consome uma quantidade fixa de bytes, temos também um bom balanceamento de carga.

Outras aplicações, tais como definição de setores territoriais na gestão pública, podem também fazer uso de intervalos.

Decisão soberana, na escolha entre os dois métodos de indexação: “Curva Z” de Morton, ruim para intervalos (mas boa em performance); e “Curva U” de Hilbert, boa para intervalos. A demanda ou não por intervalos contínuos nas aplicações priorizadas pelo país determina qual indexação utilizar.

Resumo das motivações da escolha, respondendo à pergunta "o país precisa ou não precisa de intervalos mais coerentes?". Intervalos podem ser úteis para definir zonas contíguas coerentes com a indexação e com a distribuição uniforme de uma grandeza, estabelecendo partições balanceadas:

  • na administração pública:
    • o tradicional roteamento postal, balanceando o número de endereços por partição. Objetivo maior dos códigos postais nas décadas de 1970 a 1990. Hoje com com softwares eficientes de roteamento o intervalo se prestaria à definição arbitrária de setores de distribuições.
    • definição de zonas administrativas ou jurisdição equilibradas: zonas de responsabilidade de cartórios, de tribunais ou responsabilidade fiscal. Balanceadas por gradezas como população ou volume de trabalho.
  • na infraestrutura (redes de computadores) e internamente nos bancos de dados:
    • partições em disco ou rede, para agregar dados relativos a uma mesma vizinhança espacial.
    • na visualização e estatística de dados espaciais: intervalos contínuos garantem consistência estatística, por exemplo para associação em histogramas.

Liberdade parcial para outras decisões

A proposta do padrão DNGS é que seja, dentro do possível, o mais parecido e interoperável para os diversos países que vierem a adotá-lo. Daí serem apenas 5 alternativas: quanto maior o número de alternativas, mais difícil elas resultarem em um todo interoperável. Todavia, como algumas alternativas não afetam tanto a interoperabilidade, e como por se tratarem de decisões soberanas, ficam em aberto.

Da experiência com a implantação em diferentes países, foi percebida principalmente a demanda por compatibilidade com padrões antigos. Não recomendamos o compromisso com legados, pois em geral a cobertura legada não é relevante, e a compatibilidade conquistada é parcial. A perda de compatibilidade com o geocódigo DNGS de outros países acaba sendo muito mais prejudicial do que o ganho com legados. A seguir os dois principais exemplos.

Compromisso com grades legadas?

Tipicamente as grades com quadrados de 1 km de lado são solicitadas como padrão para o intercâmbio e comparação internacionais. O uso da grade de 1024 metros todavia costuma ser aceito para esse tipo de demanda.

Compromisso com cobertura legada?

No caso do Brasil já existia uma articulação de quadrantes passível de adaptação, no caso da Colômbia nenhuma sugestão oficial. A decisão pode impactar no acréscimo de mais um dígito ao geocódigo absoluto, mas não no curto.