CNEFE: mudanças entre as edições

m
sem sumário de edição
mSem resumo de edição
 
(8 revisões intermediárias pelo mesmo usuário não estão sendo mostradas)
Linha 2: Linha 2:
CNEFE - Cadastro Nacional de Endereços para Fins Estatísticos
CNEFE - Cadastro Nacional de Endereços para Fins Estatísticos


Ver https://www.ibge.gov.br/estatisticas/sociais/populacao/38734-cadastro-nacional-de-enderecos-para-fins-estatisticos.html?edicao=40122&t=resultados
Ver [https://www.ibge.gov.br/estatisticas/sociais/populacao/38734-cadastro-nacional-de-enderecos-para-fins-estatisticos.html?edicao=40122&t=resultados página oficial do IBGE/CNEFE].
 
Para a visualização em diferentes mapas de fundo, ver https://gis.stackexchange.com/a/217670/7505
 
Pendente revisar e simplificar passo a passo.
 
PS: o nome do aparelho de coleta de dados do Cernso é [https://agenciadenoticias.ibge.gov.br/agencia-noticias/2012-agencia-de-noticias/noticias/33487-com-distribuicao-avancada-ibge-esta-perto-de-concluir-preparacao-dos-dispositivos-de-coleta-do-censo-2022  Dispositivo Móvel de Coleta (DMC)] (repassado para o Ministério da Saúde).


== Faces de Quadra ==
== Faces de Quadra ==
Pegar em 4314902_faces_de_logradouros_2021.prj
Pegar em 4314902_faces_de_logradouros_2021.prj o SRID da projeção usada.
 
Fonte em [https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/28971-base-de-faces-de-logradouros-dobrasil.html?=&t=acesso-ao-produto IBGE/base faces de quadra/acesso ao produto]. Descritivo em [https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/28971-base-de-faces-de-logradouros-dobrasil.html?=&t=sobre Sobre a publicação]. [https://www.youtube.com/watch?v=aFluEBKXTCs  aula do IBGE para os agentes usando celular]. [https://www.youtube.com/watch?v=rDAQ1Du9pa4 Mais uma boa aula Tanaka].
 
Para POA utilizamos esses originais, com download de maio de 2024:
<pre>
3ad3031f5503a4404af825262ee8232cc04d4ea6683d42c5dd0a2f2a27ac9824  4314902_faces_de_logradouros_2021.cpg
e55572718b6bc70f3f32bc58c81cecaf48aa1aebeec313ae20e567e81f3d235d  4314902_faces_de_logradouros_2021.dbf
c9b61f7c5c0d268153118af4183b06d943c1652e94e1201f513a6dcf0ab06567  4314902_faces_de_logradouros_2021.prj
de05db0b048dab811c900c28f6bde2c77f9e3d277011c03801390d20ef838a51  4314902_faces_de_logradouros_2021.shp
2c83a1e2f6c69e1ea331d59166dc2ff612206e42e7511a5bddc2d1fe2df9d07f  4314902_faces_de_logradouros_2021.shx
</pre>
 
Falta conferir se usamos mesmo a fonte mais atual no DL Digital-guard. Conferir com  https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/28971-base-de-faces-de-logradouros-do-brasil.html
Resumo das explicações  [https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/28971-base-de-faces-de-logradouros-do-brasil.html?=&t=sobre na aba "Sobre"].


<pre>
<pre>
Linha 40: Linha 60:
Por cidade temos [https://www.ibge.gov.br/estatisticas/downloads-estatisticas.html?caminho=Cadastro_Nacional_de_Enderecos_para_Fins_Estatisticos/Censo_Demografico_2022/Arquivos_CNEFE/Municipio Censo_Demografico_2022/Arquivos_CNEFE/Municipio], direto latLong em srid=4326.
Por cidade temos [https://www.ibge.gov.br/estatisticas/downloads-estatisticas.html?caminho=Cadastro_Nacional_de_Enderecos_para_Fins_Estatisticos/Censo_Demografico_2022/Arquivos_CNEFE/Municipio Censo_Demografico_2022/Arquivos_CNEFE/Municipio], direto latLong em srid=4326.


Pelo cabeçalho podemos copiar para uma tabela texto,  
Esta [https://www.ibge.gov.br/estatisticas/sociais/populacao/38734-cadastro-nacional-de-enderecos-para-fins-estatisticos.html?edicao=40122&t=resultados página dá acesso ao Excel de descrição, "Dicionário"].  Pelo cabeçalho podemos copiar para uma tabela texto, depois testar se a algumas converções de tipo são válidas.


<pre>
<pre>
Linha 123: Linha 143:
       sqrt(avg(st_area(ST_GeomFromGeoHash(ghs10),true))) as ghs10_precisao
       sqrt(avg(st_area(ST_GeomFromGeoHash(ghs10),true))) as ghs10_precisao
from vw02_ibge_cnefe2022
from vw02_ibge_cnefe2022
; -- 4.437 ~ 5 metros de precisão no Geohash de 9 dígitos. 0.7844 ~ 1 metro no de 10 dígitos.
; -- ghs9_precisao = 4.437 ~ 5 metros de precisão no Geohash de 9 dígitos.  
  -- ghs10_precisao = 0.7844 ~ 1 metro no Geohash de 10 dígitos.
-- select round(100.0*x/762239) perc_x_of_n;
-- select round(100.0*x/762239) perc_x_of_n;
select round(100.0*393565/762239) perc_x_of_n;


select compl1, count(*) n_casos FROM (
select compl1, count(*) n_casos FROM (
   select ghs, array_agg(distinct nom_comp_elem1) compl1 from vw02_ibge_cnefe2022 group by 1 having count(*)>1
   select ghs9, array_agg(distinct nom_comp_elem1) compl1 from vw02_ibge_cnefe2022 group by 1 having count(*)>1
) t group by 1 order by 2 desc, 1;
) t group by 1 order by 2 desc, 1;
                      compl1                        | n_casos  
select compl, count(*) n_casos FROM (
------------------------------------------------------+---------
  select ghs10, array_agg(distinct coalesce(nom_comp_elem1,'')||coalesce(' '||nom_comp_elem2,'')) compl from vw02_ibge_cnefe2022 group by 1 having count(*)>1
  {NULL}                                               18184
) t group by 1 order by 2 desc, 1limit  10;
  {APARTAMENTO}                                       |   14736
        compl        | n_casos  
  {CASA}                                               |    8485
-----------------------+---------
  {FRENTE,FUNDOS}                                     |    5855
  {APARTAMENTO}         15620
{CASA,NULL}                                          |    4651
  {""}                 |   6945
  {BLOCO}                                             |    3873
  {CASA}               |    5642
  {FUNDOS,NULL}                                       |    2508
  {FRENTE,FUNDOS}       |    4616
  {FRENTE,NULL}                                       |    1331
  {"BLOCO APARTAMENTO"} |    3694
  {FUNDOS}                                             |   1111
  {"",FUNDOS}           |    1285
  {SOBRADO,TERREO}                                     |   1025
  {"",CASA}             |    1231
  {APARTAMENTO,NULL}                                   |    951
  {FUNDOS}             |     877
  {CASA,FUNDOS}                                        |     653
  {SOBRADO,TERREO}     |     821
  {"",FRENTE}           |    349
                total |   41080 = 5.4% de 762239; ou 10.6% de 389028.
</pre>
</pre>
{|class="wikitable"|
{|class="wikitable"|
|-
|-
Linha 166: Linha 186:
* Identificadores únicos: era esperada a unicidade em 100% dos registros, ou seja,  que ''n''=''n_cod_uend''. Houve, todavia, uma diferença de 0,6% (100% - 99,4%), devido a casos de repetição. O valor de contagens superiores a 1 resultou em média de 2,01±0,07; portanto maioria dos 9433 identificadores problemáticos tem apenas mais 1 outro domicílio apresentando mesmo identificador.
* Identificadores únicos: era esperada a unicidade em 100% dos registros, ou seja,  que ''n''=''n_cod_uend''. Houve, todavia, uma diferença de 0,6% (100% - 99,4%), devido a casos de repetição. O valor de contagens superiores a 1 resultou em média de 2,01±0,07; portanto maioria dos 9433 identificadores problemáticos tem apenas mais 1 outro domicílio apresentando mesmo identificador.


*  A contagem de ''n_latlon'', com apenas 51% ao invés de 100%, mostra a intensão do IBGE em incluir nos registros os casos de endereço horizontais iguais porém com complemento diferenciando, o que se confirma pelas contagens no perfil de ''compl1''.  A rigor o IBGE registrou "endereços domicíliares", não apenas "endereços de rua". Neste relatório denominaremos o primeiro de domicílio ('''dom''') e o segundo de endereço de fato ('''end''') ou ponto.
*  A contagem de ''n_latlon'', com apenas 51% ao invés de 100%, mostra a intensão do IBGE em incluir nos registros os casos de endereço horizontais iguais porém com complemento diferenciando, o que se confirma pelas contagens no perfil dos complementos (vide amostragem ''compl1'' e ''compl2'' em ~11% dos casos de ''n_latlon'').  A rigor o IBGE registrou "endereços domicíliares", não apenas "endereços de rua". Neste relatório denominaremos o primeiro de domicílio ('''dom''') e o segundo de endereço de fato ('''end''') ou ponto.


* A escolha entre Geohashes de 9 ou 10 metros dependeria da precisão média dos pontos do IBGE. Como demonstra a nuvem de pontos, é bastante
*  A contagem de ''n_ghs9'' fez uso de Geohashes de 9 dígitos, garantindo a precisão da ordem de 5 metros, ou seja, superior ao erro de GPS da núvem de pontos. A contagem ''n_ghs9'' resultou em 46%, bem longe dos 51% de ''n_latlon'', gerando talvez duplicidade maior do que esperada. Como a precisão é variável (depende dos satélites GPS e do [https://www.youtube.com/watch?v=AVW40YB3v2s tempo de espera do agente]), sugere-se usar ''ghs10'' ou manter o ponto original e só depois do translado para a face de quadra (que aumenta a precisão) fazer a contagem de Geohashes ''ghs10''.
*  A contagem de ''n_ghs9'' fez uso de Geohashes de 9 dígitos, garantindo a precisão da ordem de 5 metros, ou seja, superior ao erro de GPS da núvem de pontos. A contagem ''n_ghs9'' resultou em 46%, bem longe dos 51% de ''n_latlon'', gerando talvez duplicidade maior do que esperada. Como a precisão é variável (depende dos satélites GPS e do [https://www.youtube.com/watch?v=AVW40YB3v2s tempo de espera do agente]), sugere-se usar ''ghs10'' ou manter o ponto original e só depois do translado para a face de quadra (que aumenta a precisão) fazer a contagem de Geohashes ''ghs10''.
    
    
Linha 188: Linha 209:


<pre>
<pre>
-- por pontos únicos
-- por pontos únicos em ghs9
with t as (select count(*) as nt, count(distinct ghs) ntpt  from vw02_ibge_cnefe2022) select nv_geo_coord, count(distinct ghs) n_pts, round(100.0*count(distinct ghs)/t.ntpt,2)::text||'%' as perc  from t,vw02_ibge_cnefe2022 group by 1,ntpt order by 1;
with t as (select count(distinct ghs9||nv_geo_coord) ntpt  from vw02_ibge_cnefe2022) select nv_geo_coord, count(distinct ghs9) n_ghs9s, round(100.0*count(distinct ghs9)/t.ntpt,2)::text||'%' as perc  from t,vw02_ibge_cnefe2022 group by 1,ntpt order by 1;
</pre>
</pre>
{|class="wikitable"|
{|class="wikitable"|
|-
|-
! nv_geo_coord !! n_pts !!  perc   
! nv_geo_coord !! n_ghs9s !!  perc   
|-
|-
| 1 = Endereço - coordenada original do Censo 2022          || 343098 || 97.85%
| 1 = Endereço - coordenada original do Censo 2022          || 343098 || 95.84%
|-
|-
| 2 = Endereço - coordenada modificada (apartamentos em um mesmo número no logradouro). ||  11224 || 3.20%
| 2 = Endereço - coordenada modificada (apartamentos em um mesmo número no logradouro). ||  11224 || 3.14%
|-
|-
| 3 = Endereço - coordenada estimada (endereços originalmente sem coordenadas ou coordenadas inválidas).  ||  2865 || 0.82%
| 3 = Endereço - coordenada estimada (endereços originalmente sem coordenadas ou coordenadas inválidas).  ||  2865 || 0.80%
|-
|-
| 4 = Face de quadra. ||    798 || 0.23%
| 4 = Face de quadra. ||    798 || 0.22%
|-
|-
| 5 = Localidade ||      3 || 0.00%
| 5 = Localidade ||      3 || 0.00%
Linha 209: Linha 230:
Conclusão: como queremos filtrar até o nível de pontos únicos, há garantia de 99,9% dos endereços em condição adequada (tipos 1 ou 2).
Conclusão: como queremos filtrar até o nível de pontos únicos, há garantia de 99,9% dos endereços em condição adequada (tipos 1 ou 2).


=== Filtragens ===
As filtragens seguem o seguinte passo a passo:
As filtragens seguem o seguinte passo a passo:


2 402

edições