osmc:Metodologia: mudanças entre as edições

1 256 bytes adicionados ,  Segunda-feira às 22h13min
m (→‎Escolha oficial da origem: img documentando opção)
 
(24 revisões intermediárias por 2 usuários não estão sendo mostradas)
Linha 1: Linha 1:
{{osmc_info}}
{{osmc_info}}


Descrição da metodologia e algoritmos do sistema <code>AFA.codes</code>. Segue em parte um padrão, em parte as [[DNGS/Decisões soberanas|decisões soberanas do país]].
A metodologia e algoritmos do sistema <code>AFA.codes</code> seguem em parte um padrão e em parte as [[DNGS/Decisões soberanas|decisões soberanas do país]].


O sistema AFAcodes implementou a metodologia sugerida pelo padrão [[DNGS]], portanto muito parecida com a do padrão ISO [[DGGS]], ambas iniciam por uma grade grosseira, particionando uma superfície com grandes células de igual-área.
O sistema AFAcodes implementou a metodologia sugerida pelo padrão [[DNGS]], semelhante ao padrão ISO [[DGGS]], particionando uma superfície com grandes células de igual-área.


A diferença da metodologia DNGS para a DGGS é que a superfície DNGS é um território nacional, ao invés do globo inteiro. O padrão DNGS é também mais restritivo, impõe projeção válida (oficial nacional), [[geocódigos]] válidos, tamanhos e formatos de célula válidos (quadriláteros em potências de 2) e um limite ao número de células iniciais (até 16).
A diferença da metodologia [[DNGS]] para a [[DGGS]] é que a superfície [[DNGS]] é um território nacional, ao invés do globo inteiro. O padrão [[DNGS]] é também mais restritivo, demandando projeção (oficial nacional), [[geocódigos]], tamanhos e formatos de células válidos (quadriláteros em potências de 2) e um limite na quantidade de células iniciais (até 16).


== Projeção e cobertura nacionais ==
== Projeção e cobertura nacionais ==


Começa-se com o mapa dos limites territoriais na [[DNGS/Decisões_soberanas#D2._Projeção_de_igual-área?|projeção igual-área]] adotada oficialmente pelo país, designada '''projeção igual-área nacional'''. Os limites podem abranger a [[wikipedia:Exclusive_economic_zone|Zona econômica exclusiva]] e arquipélagos, conforme [[DNGS/Decisões soberanas|decisão soberana]] do país.
Começa-se com o mapa dos limites territoriais na [[DNGS/Decisões_soberanas#D2._Projeção_de_igual-área?|projeção igual-área]] adotada oficialmente pelo país, designada '''projeção igual-área nacional'''. Os limites podem abranger [[wikipedia:Maritime_boundary|limites marítimos]] e arquipélagos, conforme [[DNGS/Decisões soberanas|decisão soberana]] do país.


[[Arquivo:Osmc-CO-projOficial.png|centro|miniaturadaimagem|380px|''Projeção igual-área nacional'' da Colômbia. Não é perfeita mas é satisfatória para o Censo. <br/>As tonalidades (vermelhas e azuis) representam o ''perfil de distorção de área'' (inferior a 2%) na projeção cilíndrica UTM oficial da Colômbia, "resolución 471 de 2020 del IGAC".]]
[[Arquivo:Osmc-CO-projOficial.png|centro|miniaturadaimagem|380px|''Projeção igual-área nacional'' da Colômbia. Não é perfeita mas é satisfatória para o Censo. <br/>As tonalidades (vermelhas e azuis) representam o ''perfil de distorção de área'' (inferior a 2%) na projeção cilíndrica UTM oficial da Colômbia, "resolución 471 de 2020 del IGAC".]]


[[Arquivo:Osmc-CO-Powers2.png|280px|miniaturadaimagem|[[wikipedia:Power of two|Potências de 2]], partindo do metro e crescendo até o valor correspondente à largura das células da cobertura ''L0''. <br/>Conforme a [[Prefixos binários|convenção IEC de prefixos binários]], múltiplos de 1024 metros são abreviados como '''Kim''' (''kilobinary meter'').]]
[[Arquivo:Osmc-CO-Powers2.png|280px|miniaturadaimagem|[[wikipedia:Power of two|Potências de 2]], partindo do metro e crescendo até o valor correspondente à largura das células da cobertura ''L0''. <br/>Conforme a [[Prefixos binários|convenção IEC de prefixos binários]], múltiplos de 1024 metros são abreviados como '''Kim''' (''[[wikipedia:Binary_prefix|kilobinary meter]]'').]]


Sobre o polígono dos limites territoriais é encaixada uma grade de ''potência de 2'' (tabela ao lado), onde será desenhado um mosaico de no '''máximo 16 quadrados'''. O encaixe é obtido por um '''algoritmo de varredura''', testa-se com grades maiores e menores, sobre a '''BBOX dos polígonos territoriais'''.
Sobre o polígono dos limites territoriais é encaixada uma grade de ''potência de 2'' (tabela ao lado), onde será desenhado um mosaico de no '''máximo 16 quadrados'''. O encaixe é obtido por um '''algoritmo de varredura''', testa-se com grades maiores e menores, sobre a '''BBOX dos polígonos territoriais'''.


No caso da Colômbia o '''melhor encaixa''' foi conseguido com quadrados de 2<sup>19</sup> m  de lado, ou seja, 2<sup>19</sup>&nbsp;m =524,29&nbsp;km =&nbsp;512×1024&nbsp;m =&nbsp;'''512&nbsp;Kim'''.
[[Arquivo:Osmc-CO-coverEx1.png|centro|miniaturadaimagem|420px|No caso da Colômbia o '''melhor encaixe''' foi conseguido com quadrados de 2<sup>19</sup> m  de lado, ou seja, 2<sup>19</sup>&nbsp;m = 524288&nbsp;m =&nbsp;512×1024&nbsp;m =&nbsp;'''512&nbsp;Kim'''. Em destaque, os quadrados que cobrem  o território e formam a "'''cobertura nacional'''", com as coordenadas ''ji'' (''i'' horizontal e ''j'' vertical).]]


Abaixo, em roxo, com ''ij'' as coordenadas ''i'' horizontal e ''j'' vertical, o conjunto dos quadrados que cobrem  o território, apelidado de "'''cobertura nacional'''".  
===Escolha oficial da origem===
[[Arquivo:OSMC-CO-Origem-ilustra.png|miniaturadaimagem|Ajuste fino de posição para escolha da origem-XY. No caso da Colômbia a origem é o ponto XY (3678500,1494288) na projeção de SRID=9377.<br/>PS: as outras alternativas (ex. sem parte insular nem zona econômica), descartadas, [https://raw.githubusercontent.com/osm-codes/CO_new/main/assets/bbox-v3mins.800px.png foram documentadas].]]


[[Arquivo:Osmc-CO-coverEx1.png|centro|semmoldura|420px]]
Conforme previsto [[DNGS/Decisões_soberanas#D2.1._Eixos_das_coordenadas_de_referência|na metodologia DNGS para escolha das coordenadas de referência]], um ajuste fino da posição da ''cobertura nacional'' é necessário para se estabelecer em definitivo o sistema de coordenadas e, consequentemente, os identificadores de célula.


===Escolha oficial da origem===
Apesar de ser uma escolha objetiva, baseada no simples encaixe nos limites oficiais, a escolha desses limites requer decisões soberanas, tais como escolha do buffer de segurança, e decisões sobre uso ou não de limites marítimos.
[[Arquivo:OSMC-CO-Origem-ilustra.png|miniaturadaimagem|Ajuste fino de posição para escolha da origem-XY.]]
Conforme previsto [[DNGS/Decisões_soberanas#D2.1._Eixos_das_coordenadas_de_referência|na metodologia DNGS para escolha das coordenadas de referência]], um ajuste fino da posição da ''cobertura nacional'' é necessário para se estabelecer em definitivo o sistema de coordenadas e, consequentemente, os identificadores de célula.


Apesar de ser uma escolha objetiva, baseada no simples encaixe nos limites oficiais, a escolha desses limites requer decisões suberanas, tais como escolha do buffer de segurança, e decisões sobre uso ou não da zona econômica. <br/>PS: as outras alternativas (ex. sem parte insular nem zona econômica), descartadas, [https://raw.githubusercontent.com/osm-codes/CO_new/main/assets/bbox-v3mins.800px.png foram documentadas].
=== Decisões sobre ajuste e desmembramento ===
[[Arquivo:BR-L0coverSci-f.png|miniaturadaimagem|380px|Desmembramento da célula "f" no Brasil, que resultou na partição em 8 células-filhas, do nível ''L1.5''. Apenas 4 delas em uso, as 4 restantes são reservas.]]


No caso da colômbia a origem é o ponto XY (3678500,1494288) na projeção de SRID=9377.
O algoritmo de escolha das células ''L0'' é relativamente simples, resulta da interseção do polígono com a grade: se o número de células exceder a 16, será utilizada uma grade de nível mais grosseiro.  


===Indexação L0===
Por ser uma decisão definitiva e com grande impacto na posterior usabilidade da grade, é uma decisão delicada, requer "ajuste humano", e portanto decisões adicionais. Principais exemplos de causa e ajuste: erros implícitos nas delimitações territoriais, importância das delimitações (divisor oceânico vs divisor territorial), decisões por reserva (maior em territórios disputados) e descontinuidades, tais como as ilhas do Havaí no polígono territorial dos EUA, que requerem inclusive uma projeção diferente.
Em seguida os 16 quadrados recebem indexadores (rótulos) sequenciais no lugar de coordenadas ''ij''.


[[Arquivo:Osmc-CO-coverEx2.png|centro|miniaturadaimagem|580px]]
Uma das soluções técnicas para garantir a cobertura nacional em 16 células ''L0'' é o desmembramento, ilustrado para o caso do Brasil. O algoritmo de cobertura requer mínimo de ~30% de taxa de ocupação territorial sobre a célula de cobertura. As células com "grandes vazios" são candidatas ao desmembramento para que seus geocódigos possam ser reutilizados em porções desconexas, tipicamente as insulares (ilustração).


A sequência de indexação é arbitrária, poderia ser de cima para baixo da esquerda para a direita. Todavia, a formação da grade, conforme veremos a seguir, exige a [[DNGS/Decisões_soberanas#D4._Intervalos_de_geocódigos?|escolha de uma curva de preenchimento]] (Curva-Z no caso foi a escolha soberana da Colômbia).
===Indexação L0===
Em seguida os 16 quadrados recebem indexadores (rótulos) arbitrários no lugar de coordenadas ''ji''. Todavia, a formação da grade, conforme veremos a seguir, exige a [[DNGS/Decisões_soberanas#D4._Intervalos_de_geocódigos?|escolha de uma curva de preenchimento]].


Os cálculos de vizinhança na curva de preenchimento são complexos, quanto maior a quantidade de células ''L0'' que preservarem a distribuição de vizinhança original, mais simples o algoritmo de cálculo de vizinhança. Simplificar ou não o algoritmo (otimizar) é também uma decisão soberana.
Os cálculos de vizinhança na curva de preenchimento são complexos, quanto maior a quantidade de células ''L0'' que preservarem a distribuição de vizinhança original, mais simples o algoritmo de cálculo de vizinhança. Simplificar ou não o algoritmo (otimizar) é também uma decisão soberana.


[[Arquivo:Osmc-CO-cover-L0-Zcurve.png|thumb|280px|Indexação de ''L0'' na Colômbia, ajustada à Curva-Z. 81% das células ajustadas, apenas 3 (em roxo) fora do ordem. Toda a cobertura continental (amarelo) dentro da ordem.]]
A partir de então, conforme veremos, é adotado como oficial (notação científica para o Censo e outras aplicações) o rótulo hexadecimal de células da grade oficial, tendo como primeiro dígito os rótulos do mapa acima, do nível ''L0''.


Na Colômbia '''a decisão foi por otimizar''', ou seja, seguir-se, dentro do possível, a curva de preenchimento em ''L0''. Na ilustração ao lado a cobertura continental em amarelo, e os índices fora de ordem em roxo. O indexador, para sua representação humana, usando a representação hexadecimal (base 16), que vai de "0" a "9" e "a" a "f".
[[Arquivo:Osmc-CO-coverEx2.png|centro|miniaturadaimagem|420px|Na Colômbia, a decisão soberana foi por seguir a Curva-Z, dentro do possível. Na ilustração, a cobertura nacional com os índices em sua representação humana, usando a representação hexadecimal ([[Código_natural/Notação_posicional#Base_Nh|base16h]]), que vai de "0" a "9" e "a" a "f".]]


A partir de então, conforme veremos, é adotado como oficial (notação científica para o Censo e outras aplicações) o rótulo hexadecimal de células da grade oficial, tendo como primeiro dígito os rótulos do mapa acima, do nível ''L0''.
[[Arquivo:Osmc-CO-cover-L0-Zcurve.png|thumb|280px|Indexação de ''L0'' na Colômbia, ajustada à Curva-Z. 81% das células ajustadas, apenas 3 (em roxo) fora do ordem. Toda a cobertura continental (amarelo) dentro da ordem.]]


==Formação da grade científica nacional==
==Formação da grade científica nacional==
Linha 113: Linha 113:
As coberturas todas, de todos os municípios, não é uma caixa preta como a definição dos bairros. O padrão [[DNGS]] exige que as coberturas municipais sejam dados abertos. No  caso dos AFAcodes da Colômbia, que  implementam DNGS, os dados das coberturas municipais estão em https://git.afa.codes/CO_new/blob/main/data/coverage.csv
As coberturas todas, de todos os municípios, não é uma caixa preta como a definição dos bairros. O padrão [[DNGS]] exige que as coberturas municipais sejam dados abertos. No  caso dos AFAcodes da Colômbia, que  implementam DNGS, os dados das coberturas municipais estão em https://git.afa.codes/CO_new/blob/main/data/coverage.csv


==Seletor de jurisdição==
==Seletores de SRID e jurisdição==
[[Arquivo:DNGS-BBOXes-exemplo2.png|thumb|380px|"Globo DNGS" quando apenas Brasil e Colômbia adotavam o padrão.
[[Arquivo:DNGS-BBOXes-exemplo2.png|thumb|380px|"Globo DNGS" quando apenas Brasil e Colômbia adotavam o padrão.
A BBOX original de cada país é decomposta em BBOXes "puras" e "de fronteira". As puras permitem rápida decisão (alta performance), enquanto as de fronteira, ''border boxes'' em rosa, requerem avaliação de pertinência ao polígono de fronteira.]]
A BBOX original de cada país é decomposta em BBOXes "puras" e "de fronteira". As puras permitem rápida decisão (alta performance), enquanto as de fronteira, ''border boxes'' em rosa, requerem avaliação de pertinência ao polígono de fronteira.]]
Linha 124: Linha 124:


==Ver também==
==Ver também==
* Detalhamento técnico da metodologia em [[osmc:Metodologia/Algoritmo SQL]]
*Convenções AFAcodes:
*Convenções AFAcodes:
**[[osmc:Convenções/Grade científica multifinalitária]]
**[[osmc:Convenções/Grade científica multifinalitária]]
198

edições