Ref-list/convert/KraEtAll2022b: mudanças entre as edições

De Documentação
(Criou página com 'O Código de Endereçamento Postal (CEP) do Brasil nunca foi uma tecnologia aberta [1]; sua listagem e base de dados são vistas como fonte de lucros desde a promulgação da Lei 6.538/78, tendo esse aspecto recebido reforço de patente em 2003 [2], apesardo flagrante inconstitucionalidade. Hoje considerada uma tecnologia ultrapassada, o geocódigo de 8 dígitos é incapaz de localizar endereços. A proposta OSMcodes [3] nasceu como esforço para demonstrar a existênci...')
 
Sem resumo de edição
Linha 22: Linha 22:
diferenciando-se do geocódigo postal. Ambos geocódigos são aderentes à proposta de extensão
diferenciando-se do geocódigo postal. Ambos geocódigos são aderentes à proposta de extensão
do padrão GeoURI [7].
do padrão GeoURI [7].
As decisões de projeto tomadas podem ser resumidas como se segue:
: D1- Optamos por contemplar múltiplas finalidades, nesta ordem de prioridade: aplicações postais (“novo CEP”), aplicações estatísticas, computacionais, cadastrais (registro de imóvel e delimitação grosseira, porém confiável dos terrenos), econômicas, ambientais (ex. transectos) e outras. Todas elas se beneficiando da interoperabilidade e da padronização, bem como se beneficiando da hierarquia dos geocódigos.
: D2 - Projeção de igual-área: adotamos a projeção Albers da Grade do IBGE.
: D3 - Área territorial grande: devido a sua abrangência territorial, de escala continental, o Brasil precisa adotar dois sistemas distintos de geocódigo, um mais compacto para aplicações postais, em base32, e outro, abrangendo o primeiro, com mais níveis hierárquicos, porém fazendo uso de geocódigo base16h (interoperável com a base32) para aplicações científicas.
: D4 - Compromisso com as grades legadas: houve compromisso com a projeção adotada pela Grade IBGE, mas não com as escalas adotadas por ela. Entendemos que as potências de dois proporcionam a escala natural da divisão sucessiva dos quadriláteros em 4.
: D5 - Compromisso com cobertura legada: já existia uma articulação de 56 quadrantes (500 km de lado) passível de adaptação, no entanto optamos por utilizar uma opção mais eficiente, com apenas 1 dígito em base32.
: D6 - Intervalos de geocódigos: entendemos que nas aplicações avaliadas não há demanda por intervalos contínuos, de modo que a escolha da “Curva Z” de Morton é a mais apropriada.
: D7 - Uso de vogais: em questionário aplicado a um pequeno conjunto de cidadãos brasileiros concluiu-se que a maioria prefere códigos alfanuméricos que não se confundam com palavras. A escolha, portanto, da base32, recaiu sobre o alfabeto NVU (No Vogals except U),
definido em [8].
: D8 - Uso de abreviações ao invés de nomes extensos: optou-se, para o geocódigo postal, pela adoção de abreviações de 3 letras do nome de cada município, no contexto do estado. Por exemplo Campinas abreviada como BR-SP-CAM, Itu como BR-SP-ITU.
O sistema de grades brasileiro resultante das decisões pode ser tecnicamente
caracterizado por:
*  Projeção Albers, expressa em string PROJ [9]: “<code>+proj=aea +lat_0=-12 +lon_0=-54 +lat_1=-2 +lat_2=-22 +x_0=5000000 +y_0=10000000 +ellps=WGS84 +units=m</code>”.
* Origem do sistema de referência em: <code>X=2715000, Y=6727000</code>.
* Quantização do nível L0 iniciando com h0=1.048.576 metros.
* Curva de indexação: Morton (resultando em "curva Z" de preenchimento espacial nos níveis inteiros e "curva N" nos intermediários).
* Representação interna do identificador de célula (ID): número inteiro positivo de 64 bits (Bigint), com código do país funcionando como “hidden bit”, semântica de Natural Code [8].
Geocódigo científico:
* Representação humana do ID de célula em base16h, conforme [8]. Disponibilidade de 40 níveis hierárquicos, desde a célula do nível zero (L0) com 1024² metros de lado (~1049 km), até a célula nível 20, com 1 metro de lado; e mais 20 níveis intermediários (L+½) em grade degenerada.
Geocódigo postal:
* Prefixo mnemônico: por jurisdição municipal (OSM admin_level=8), abreviação de 2 letras por UF e abreviação por 3 letras do município, seguindo extensão do padrão ISO e nome canônico por sintaxe “ISO label extended”.
* Indexação do prefixo mnemônico: algoritmo de cobertura conforme publicado em [6], com no mínimo 6 e no máximo 32 células.
* Sufixo de localização na grade: representação humana do ID de célula em base32 com alfabeto NVU (“0123456789BCDFGHJKLMNPQRSTUVWXYZ”), descrito em [8]. Número de níveis variável conforme município. Menor célula recomendada: 1 m². Célula urbana recomendada: 32 m². Célula rural recomendada: 1024 m² (32 m de lado). Níveis inteiros (L) e intermediários (L+½) intercalados a cada dígito adicional.

Edição das 22h35min de 19 de junho de 2023

O Código de Endereçamento Postal (CEP) do Brasil nunca foi uma tecnologia aberta [1]; sua listagem e base de dados são vistas como fonte de lucros desde a promulgação da Lei 6.538/78, tendo esse aspecto recebido reforço de patente em 2003 [2], apesardo flagrante inconstitucionalidade. Hoje considerada uma tecnologia ultrapassada, o geocódigo de 8 dígitos é incapaz de localizar endereços. A proposta OSMcodes [3] nasceu como esforço para demonstrar a existência de alternativas, com metodologias, algoritmos e dados totalmente abertos, sob licença CC0. Além de garantir um geocódigo satisfatório para o a localização exata da residência do cidadão brasileiro, que com 7 dígitos ou menos “chega na porta de casa”, a proposta abrange outras finalidades. O mesmo sistema de grades hierárquicas que abriga a proposta de geocódigo postal faz parte de um conjunto maior, de 40 grades com refinamentos sucessivos até 1 metro, denominado Grade Científica OSMcodes. Sendo baseada em projeção de igual-área, satisfaz as aplicações estatísticas, econômicas, ambientais, logísticas, cadastrais e muitas outras, por seu geocódigo permitir também a indexação espacial e o uso como quadtree.

Seu desenvolvimento teve como ponto de partida a Grade Estatística do IBGE de 2016 [4], com proposta formalizada em 2020 [5]. A grade estatística do IBGE pode ser representada de forma mais compacta através de um inteiro de 64 bits, que traz diversas vantagens, computacionais e de distribuição [6]. Ainda assim, ela apresentava problemas, sendo seu geocódigo muito longo e não-hierárquico. A “Nova Grade Estatística do Brasil”, proposta pela OSMcodes, resolve esses problemas, de modo que os geocódigos dela resultantes foram denominados “geocódigos científicos”, em alusão à notação científica numérica, e diferenciando-se do geocódigo postal. Ambos geocódigos são aderentes à proposta de extensão do padrão GeoURI [7].

As decisões de projeto tomadas podem ser resumidas como se segue:

D1- Optamos por contemplar múltiplas finalidades, nesta ordem de prioridade: aplicações postais (“novo CEP”), aplicações estatísticas, computacionais, cadastrais (registro de imóvel e delimitação grosseira, porém confiável dos terrenos), econômicas, ambientais (ex. transectos) e outras. Todas elas se beneficiando da interoperabilidade e da padronização, bem como se beneficiando da hierarquia dos geocódigos.
D2 - Projeção de igual-área: adotamos a projeção Albers da Grade do IBGE.
D3 - Área territorial grande: devido a sua abrangência territorial, de escala continental, o Brasil precisa adotar dois sistemas distintos de geocódigo, um mais compacto para aplicações postais, em base32, e outro, abrangendo o primeiro, com mais níveis hierárquicos, porém fazendo uso de geocódigo base16h (interoperável com a base32) para aplicações científicas.
D4 - Compromisso com as grades legadas: houve compromisso com a projeção adotada pela Grade IBGE, mas não com as escalas adotadas por ela. Entendemos que as potências de dois proporcionam a escala natural da divisão sucessiva dos quadriláteros em 4.
D5 - Compromisso com cobertura legada: já existia uma articulação de 56 quadrantes (500 km de lado) passível de adaptação, no entanto optamos por utilizar uma opção mais eficiente, com apenas 1 dígito em base32.
D6 - Intervalos de geocódigos: entendemos que nas aplicações avaliadas não há demanda por intervalos contínuos, de modo que a escolha da “Curva Z” de Morton é a mais apropriada.
D7 - Uso de vogais: em questionário aplicado a um pequeno conjunto de cidadãos brasileiros concluiu-se que a maioria prefere códigos alfanuméricos que não se confundam com palavras. A escolha, portanto, da base32, recaiu sobre o alfabeto NVU (No Vogals except U),

definido em [8].

D8 - Uso de abreviações ao invés de nomes extensos: optou-se, para o geocódigo postal, pela adoção de abreviações de 3 letras do nome de cada município, no contexto do estado. Por exemplo Campinas abreviada como BR-SP-CAM, Itu como BR-SP-ITU.

O sistema de grades brasileiro resultante das decisões pode ser tecnicamente caracterizado por:

  • Projeção Albers, expressa em string PROJ [9]: “+proj=aea +lat_0=-12 +lon_0=-54 +lat_1=-2 +lat_2=-22 +x_0=5000000 +y_0=10000000 +ellps=WGS84 +units=m”.
  • Origem do sistema de referência em: X=2715000, Y=6727000.
  • Quantização do nível L0 iniciando com h0=1.048.576 metros.
  • Curva de indexação: Morton (resultando em "curva Z" de preenchimento espacial nos níveis inteiros e "curva N" nos intermediários).
  • Representação interna do identificador de célula (ID): número inteiro positivo de 64 bits (Bigint), com código do país funcionando como “hidden bit”, semântica de Natural Code [8].

Geocódigo científico:

  • Representação humana do ID de célula em base16h, conforme [8]. Disponibilidade de 40 níveis hierárquicos, desde a célula do nível zero (L0) com 1024² metros de lado (~1049 km), até a célula nível 20, com 1 metro de lado; e mais 20 níveis intermediários (L+½) em grade degenerada.

Geocódigo postal:

  • Prefixo mnemônico: por jurisdição municipal (OSM admin_level=8), abreviação de 2 letras por UF e abreviação por 3 letras do município, seguindo extensão do padrão ISO e nome canônico por sintaxe “ISO label extended”.
  • Indexação do prefixo mnemônico: algoritmo de cobertura conforme publicado em [6], com no mínimo 6 e no máximo 32 células.
  • Sufixo de localização na grade: representação humana do ID de célula em base32 com alfabeto NVU (“0123456789BCDFGHJKLMNPQRSTUVWXYZ”), descrito em [8]. Número de níveis variável conforme município. Menor célula recomendada: 1 m². Célula urbana recomendada: 32 m². Célula rural recomendada: 1024 m² (32 m de lado). Níveis inteiros (L) e intermediários (L+½) intercalados a cada dígito adicional.