DNGS/Decisões soberanas: mudanças entre as edições

m
 
(17 revisões intermediárias por 2 usuários não estão sendo mostradas)
Linha 1: Linha 1:
Os [[geocódigos]] oficiais de um pais fazem parte da sua [[Infraestrutura Nacional de Dados Espaciais]] (INDE), e esses geocódigos oficiais, para que sejam eficientes e interoperáveis com outros países, devem ser aderentes ao [[Discrete National Grid Systems|padrão DNGS]].
Os [[geocódigos]] oficiais de um pais fazem parte da sua [[Infraestrutura Nacional de Dados Espaciais]] (INDE), e esses geocódigos oficiais, para que sejam eficientes e interoperáveis com outros países, devem ser aderentes ao [[Discrete National Grid Systems|padrão DNGS]].


Geocódigos podem ser utilizados nas mais diversas aplicações, atendendo a [[Open Data Index|múltiplas finalidades]]: os mesmo padrão de geocódigos atribuídos a endereços postais, zoneamento censitário, demarcação de terras, e utilizados no intercâmbio e nos mais diversos sistemas de informação geográfica oficiais do país.
Geocódigos podem ser utilizados nas mais diversas aplicações, atendendo a [[Open Data Index|múltiplas finalidades]]: o mesmo padrão de geocódigos atribuídos a endereços postais, zoneamento censitário, demarcação de terras, e utilizados no intercâmbio e nos mais diversos sistemas de informação geográfica oficiais do país.


O geocódigo e a sua grade de referência se tornam parte da cultura do país, portanto deve também aderir às peculiaridades culturais e geográficas do país. O padrão DNGS reconhece essa necessidade e dá liberdade suficiente para o ajuste das peculiaridades sem comprometimento da eficiência ou da compatibilidade com outras nações. O ajuste é feito através de conjunto de decisões: a cada decisão opta por uma característica do seu geocódigo.
O bom sistema de geocódigos (e respectivo sistema de grades), quando bem usado, se torna parte da cultura do país. Portanto o desenho de um bom geocódigo deve atender às peculiaridades culturais e geográficas do país. O padrão DNGS reconhece essa necessidade e dá liberdade suficiente para o ajuste das peculiaridades sem comprometimento da eficiência nem da interoperabilidade. O ajuste é feito através de decisões: a cada decisão o país opta por uma ou outra dessas "características flexíveis" do geocódigo DNGS.


Todo país é soberano para ajustar o seu geocódigo, o padrão DNGS portanto oferece uma '''Árvore de decisões soberanas que resultam nas características do novo geocódigo do país'''.  Configura-se como '''metodologia DNGS''' para a implantação de novos geocódigos, e totalmente isenta de [[DNGS/Justificativas|risco patentes ou fechamento de dados]].
Todo país é soberano para ajustar o seu geocódigo, o padrão DNGS portanto oferece uma '''Árvore de decisões soberanas que resultam nas características do geocódigo do país'''.  É o pilar da '''metodologia DNGS''' para a implantação de novos geocódigos, e totalmente isenta de [[DNGS/Justificativas|risco patentes ou fechamento de dados]]. A metodologia é orientada ao país, não aos fornecedores de tecnologia.


[[Arquivo:Osmc-method-reduced.png|miniaturadaimagem|580px|Árvore de decisão para adoção de geocódigos aderentes ao padrão DNGS. Decisões soberanas "D" e ações "A". <br/>Versão simplificada de {{ref|KraEtAll2022a}}.]]
[[Arquivo:Osmc-method-reduced.png|miniaturadaimagem|580px|Árvore de decisão para adoção de geocódigos aderentes ao padrão DNGS. Decisões soberanas "D" e ações "A". <br/>Versão simplificada de {{ref|KraEtAll2022a}}.]]
Linha 14: Linha 14:


== D1. Multifinalidade?==
== D1. Multifinalidade?==
Um país tem a liberdade de decidir entre a tecnologia [[GGeohash]] e outra qualquer.
Um país tem a liberdade de decidir entre a tecnologia [[GGeohash]] (ver sec.  [[Generalized Geohash/pt#Solução multifinalitária|"solução multifinalitária"]]) e outra qualquer.


Na visão DNGS é suposto que a tecnologia GGeohash é a única que garante geocódigos multifinalitários. Pode-se verificar se são consistentes as justificativas e fundamentos científicos para tal suposição.
Na visão DNGS é suposto que a tecnologia GGeohash é a única que garante geocódigos multifinalitários. Pode-se verificar se são consistentes as justificativas e fundamentos científicos para tal suposição.
Linha 32: Linha 32:
== D2. Projeção de igual-área?==
== D2. Projeção de igual-área?==


A [[projeção de igual-área]] é fundamental para o Censo e para todas as demais potenciais aplicações [[DLGS]] do geocódigo e do seu sistema de grades. A adoção desse tipo de projeção é em parte uma consequência natural da decisão por um geocódigo multifinalitário.
A [[projeção de igual-área]] é fundamental para o Censo e para todas as demais potenciais aplicações [[Discrete National Grid Systems/pt|DNGS]] do geocódigo e do seu sistema de grades. A adoção desse tipo de projeção é, em parte, uma consequência natural da decisão por um geocódigo multifinalitário.


Ainda assim, se o leque de aplicações adotado para a visão de multifinalidade do país não envolver aplicações científicas ou estatísticas, o os requisitos destas aplicações não forem tão rígidos, uma projeção de "quase igual-área" (ex. Mercator na região do Equador) pode ser adotada. Quanto menor a aderência a aplicações científicas, menor a demanda por igual-área, podendo inclusive adotar o não-uso de projeção, como nos padrões Geohash e OLC.  
Ainda assim, se o leque de aplicações adotado para a visão de multifinalidade do país não envolver aplicações científicas ou estatísticas, o os requisitos destas aplicações não forem tão rígidos, uma projeção de "quase igual-área" (ex. Mercator na região do Equador) pode ser adotada. Quanto menor a aderência a aplicações científicas, menor a demanda por igual-área, podendo inclusive adotar o não-uso de projeção, como nos padrões Geohash e OLC.  


A tabela do [[Open Data Index]] indica as aplicações e seus requisitos. A seguir as '''decisões soberanas''' na forma de perguntas, podendo ser numeradas na ordem apresentada, D1, D2, D3, etc.  
A tabela do [[Open Data Index]] indica as aplicações com demanda por dados abertos, e seus requisitos. Para todas elas, a grade é, do ponto de vista tecnológico e científico, o meio mais adequado para a publicação de dados governamentais.
 
Principais exemplos: censo (densidade populacional, de domicílios ocupados etc.); eleições (distribuição de votos); meteorológicos (temperatura média, insolação média,  pluviometria etc.); emergências (distribuição nas pandemias, incêndios etc.); ambientais (qualidade de água, do ar, índice vegetação etc); distribuição  orçamentária, jurisdições, propriedade da terra, e outros. Em todas essas aplicações governamentais, conforme já se demonstrou amplamente para o padrão [[DGGS]] e nas [[INDE]]s, a grade padrão do país torna os dados interoperáveis, simples de se analisar e baratos de se processar.
 
=== D2.1. Eixos das coordenadas de referência ===
A decisão seguinte à projeção é com relação à definição precisa de qual território incluir dentro do sistema de grades. Com ou sem [[wikipedia:Territorial waters|mar territorial]]? Com ou sem  [[wikipedia:Exclusive economic zone|Zona econômica exclusiva]]? Com qual [[wikipedia:Buffer analysis|''buffer'' de segurança]] nas delimitações atuais do território terrestre e divisas com outros países?
 
[[Arquivo:XY-origin-illustrating1.png|miniaturadaimagem|200px|Escolha oficial da origem XY.]]
 
São todas decisões soberanas, e que impactam na escolha final de um sistema de coordenadas otimizado para a nação. A origem dos eixos XY desse sistema será eleita em conformidade com essas decisões. Em seguida o tamanho da box também um padrão nacional, pois vai definir os identificadores de grade.
 
=== D2.2. Ajuste da Cobertura L0 ===
 
Apesar das decisões tomadas (projeção, origem e polígono nacional) e das convenções DNGS para se fixar um máximo de 16 células de cobertura territorial definidoras da grade nacional, essas células do nível ''L0'' estão sujeitas a ajustes menores, não resolvidos pelas convenções. Eles se devem principalmente ao erro de delimitação das bordas (e sua variação), às decisões por reserva (caso a nação esteja sujeita a mudanças territoriais maiores) e às decisões de desmembramento. Ver [[osmc:Metodologia#Indexação_L0|Indexação L0 na Metodologia DNGS]].


== D3a. Área territorial pequena?==
== D3a. Área territorial pequena?==
Linha 46: Linha 59:


=== D3b. Base32 NVU no geocódigo logístico? ===
=== D3b. Base32 NVU no geocódigo logístico? ===
Países maiores
Países maiores, que tomaram a ''decisão D3'' "não", fazem uso dos geocódigos de notação logística diferenciada, na base32 ao invés da base16h.  
Países , que efetivamente tomaram a ''decisão D3'' "não", fazem uso dos geocódigos de notação logística diferenciada, na base32 ao invés da base16h.  


Nesse caso, conforme alfabeto oficial e cultura (preocupação em não confundir geocódigos com palavras), países de língua escrita não-latina (ex. coreano) podem adotar, em lugar do alfabeto ''base32nvu'' (ver "''N''o ''V''ogal except ''U''" nas [[Geohash generalizado#Representação textual|opções de representação textual no Geohash Generalizado]]), outro alfabeto de sua escolha. Mesmo a ''base16h'', supostamente universal por ser extensão dos hexadecimais, pode fazer uso de letras mais apropriadas, caso desejado.
Nesse caso, conforme alfabeto oficial e cultura (preocupação em não confundir geocódigos com palavras), países de língua escrita não-latina (ex. coreano) podem adotar, em lugar do alfabeto ''base32nvu'' (ver "''N''o ''V''ogal except ''U''" nas [[Geohash generalizado#Representação textual|opções de representação textual no Geohash Generalizado]]), outro alfabeto de sua escolha. Mesmo a ''[[base16h]]'', supostamente universal por ser extensão dos hexadecimais, pode fazer uso de letras mais apropriadas, caso desejado.


Exemplo com letras dos alfabetos [[Wikipedia:Russian alphabet|russo]] e [[wikipedia:Hangul_orthography|Hangul coreano]], evitando ambiguidades e usando sequências validas para ambos, sul e norte-coreano:
Exemplo com letras dos alfabetos [[Wikipedia:Russian alphabet|russo]] e [[wikipedia:Hangul_orthography|Hangul coreano]], evitando ambiguidades e usando sequências válidas:
{| class="wikitable"
{| class="wikitable"
|+
|+
Linha 70: Linha 82:
|...
|...
|}
|}
=== D3b2. Coberturas logísticas uniformes? ===
Outro impacto da utilização da base32 vem do fato de ser um subconjunto muito menor de grades, com menos níveis:
* Coberturas municipais uniformes: apenas base 32 válidas. Garante a compatibilidade de células entre municípios, todos com mesmo tamanho, e todos chegando até o metro.
* Coberturas municipais livres: perde a compatibilidade, ganha poder de cobertura (dispensa ou reduz uso de [[osmc:Convenções/Coberturas_municipais#Cobertura-overlay|overlay]]).


== D4. Intervalos de geocódigos?==
== D4. Intervalos de geocódigos?==
Linha 75: Linha 93:
[[Arquivo:Sfc4q-intervals-comparing1.png|miniaturadaimagem|480px|Comportamento do intervalo 7 a 9. Na Curva de Morton há descontinuidade.]]
[[Arquivo:Sfc4q-intervals-comparing1.png|miniaturadaimagem|480px|Comportamento do intervalo 7 a 9. Na Curva de Morton há descontinuidade.]]


[[Arquivo:Sfc4q-intervals-Z-problem2.png|miniaturadaimagem|480px|Intervalos 4-10 (verde), 28-34 (lilás) e 55-58 (azul), mostrando o crescente de interrupções na Curva de Morton conforme se avança no tamanho da grade. Os intervalos são sempre contíguos em Hilbert.]]
[[Arquivo:Sfc4q-intervals-Z-problem2.png|miniaturadaimagem|480px|Intervalos 4-9 (verde), 28-34 (lilás) e 55-58 (azul), mostrando o crescente de interrupções na Curva de Morton conforme se avança no tamanho da grade. Os intervalos são sempre contíguos em Hilbert.]]
 
Quando associamos as células de uma grade a uma grandeza, tal como população, podemos escolher conjuntos de células contíguas que proporcionem uma distribuição uniforme da grandeza. Os conjuntos podem ser identificados de duas forma:
 
# Pelo geocódigo da célula-mãe:  geocódigo resultante do prefixo comum das células do conjunto.
# Por um intervalo de geocódigos de células vizinhas: dois geocódigos, da primeira e da última célula do intervalo.
 
A segunda forma, além de poder ser usada com a primeira, proporciona maior flexibilidade, portanto garantia maior de balanceamento. No exemplo, a garantia de que a soma da população resultante em diferentes intervalos terá aproximadamente a mesma. Por conterem todos aproximadamente o mesmo valor total da grandeza distribuída pelas suas células, dizemos que são ''partições''. Fisicamente cada partição estará armazenada em um mesmo arquivo [[Apache_Parquet#Partição|Parquet]] ou [[GeoJSON#Partição_em_git|GeoJSON]].


Em computação o balanceamento de cargas
Uma aplicação importante em computação é a distribuição equilibrada do consumo de disco (volume em bytes) pelas partições. A escolha adequada dos intervalos resulta em um bom ''balanceamento de carga'' entre as partições. Em uma tabela de pontos de endereço, por exemplo, podemos esperar que a quantidade de pontos por partição será aproximadamente a mesma. Como o registro de cada ponto consome uma quantidade fixa de bytes, temos também um bom balanceamento de carga.
entre partições de disco requer a escolha de geocódigos de diferentes
grades da hierarquia, mas uma segunda estratégia é a escolha de
intervalos de geocódigos de uma mesma grade. Outras aplicações, tais
como definição de setores territoriais na gestão pública, podem também
fazer uso de intervalos.


A&nbsp;demanda ou&nbsp;não por intervalos contínuos
Outras aplicações, tais como definição de setores territoriais na gestão pública, podem também fazer uso de intervalos.
determina qual indexação utilizar, tipicamente a escolha entre “Curva&nbsp;Z”
de Morton e “Curva&nbsp;U” de Hilbert.


Intervalos podem ser úteis para definir zonas abstratas (não-políticas) coerentes com a indexação e ao mesmo tempo uma grandeza para estabelecer partições balanceadas:
'''Decisão''' soberana, na escolha entre os dois métodos de indexação: “Curva&nbsp;Z” de Morton, ruim para intervalos (mas boa em performance); e “Curva&nbsp;U” de Hilbert, boa para intervalos. A&nbsp;demanda ou&nbsp;não por intervalos contínuos nas aplicações priorizadas pelo país determina qual indexação utilizar.
 
'''Resumo''' das motivações da escolha, respondendo à  pergunta ''"o país precisa ou não precisa de intervalos mais coerentes?"''. Intervalos podem ser úteis para definir zonas contíguas coerentes com a indexação e com a distribuição uniforme de uma grandeza, estabelecendo partições balanceadas:


* na administração pública:
* na administração pública:
** o tradicional '''roteamento postal''', objetivo maior dos códigos postais nas décadas de 1970 a 1990. Hoje com com softwares eficientes de roteamento o intervalo se prestaria à definição arbitrária de setores de distribuições.
** o tradicional '''roteamento postal''', balanceando o número de endereços por partição. Objetivo maior dos códigos postais nas décadas de 1970 a 1990. Hoje com com softwares eficientes de roteamento o intervalo se prestaria à definição arbitrária de setores de distribuições.
** definição de '''zonas administrativas''' ou jurisdição equilibradas: zonas de responsabilidade de cartórios, de tribunais ou responsabilidade fiscal.<br/>Balanceadas por gradezas como ''população'' (soma dos valores do atributo nas células do intervalo).
** definição de '''zonas administrativas''' ou jurisdição equilibradas: zonas de responsabilidade de cartórios, de tribunais ou responsabilidade fiscal. Balanceadas por gradezas como ''população'' ou ''volume de trabalho''.


* nas redes e computadores:
* na infraestrutura (redes de computadores) e internamente nos bancos de dados:
** '''partições em disco ou rede''', para agregar dados relativos a uma mesma vizinhança: alternativa ao "agregar pela célula mãe", pode trazer mais flexibilidade às estratégias de partição, consequentemente maior otimização.
** '''partições em disco ou rede''', para agregar dados relativos a uma mesma vizinhança espacial.
** na '''visualização e estatística''' de dados espaciais:  intervalos contínuos garantem consistência estatística, por exemplo para associação em histogramas.
** na '''visualização e estatística''' de dados espaciais:  intervalos contínuos garantem consistência estatística, por exemplo para associação em histogramas.


Linha 110: Linha 130:
'''Compromisso com cobertura legada?'''
'''Compromisso com cobertura legada?'''
: No caso do Brasil já existia uma articulação de quadrantes passível de adaptação, no caso da Colômbia nenhuma sugestão oficial. A decisão pode impactar no acréscimo de mais um dígito ao geocódigo absoluto, mas não no curto.
: No caso do Brasil já existia uma articulação de quadrantes passível de adaptação, no caso da Colômbia nenhuma sugestão oficial. A decisão pode impactar no acréscimo de mais um dígito ao geocódigo absoluto, mas não no curto.
 
[[Categoria:Discrete National Grid Systems]]
[[Categoria:DNGS]]
2 391

edições