2 402
edições
(→Pontos) |
mSem resumo de edição |
||
(8 revisões intermediárias pelo mesmo usuário não estão sendo mostradas) | |||
Linha 2: | Linha 2: | ||
CNEFE - Cadastro Nacional de Endereços para Fins Estatísticos | CNEFE - Cadastro Nacional de Endereços para Fins Estatísticos | ||
Ver https://www.ibge.gov.br/estatisticas/sociais/populacao/38734-cadastro-nacional-de-enderecos-para-fins-estatisticos.html?edicao=40122&t=resultados | Ver [https://www.ibge.gov.br/estatisticas/sociais/populacao/38734-cadastro-nacional-de-enderecos-para-fins-estatisticos.html?edicao=40122&t=resultados página oficial do IBGE/CNEFE]. | ||
Para a visualização em diferentes mapas de fundo, ver https://gis.stackexchange.com/a/217670/7505 | |||
Pendente revisar e simplificar passo a passo. | |||
PS: o nome do aparelho de coleta de dados do Cernso é [https://agenciadenoticias.ibge.gov.br/agencia-noticias/2012-agencia-de-noticias/noticias/33487-com-distribuicao-avancada-ibge-esta-perto-de-concluir-preparacao-dos-dispositivos-de-coleta-do-censo-2022 Dispositivo Móvel de Coleta (DMC)] (repassado para o Ministério da Saúde). | |||
== Faces de Quadra == | == Faces de Quadra == | ||
Pegar em 4314902_faces_de_logradouros_2021.prj | Pegar em 4314902_faces_de_logradouros_2021.prj o SRID da projeção usada. | ||
Fonte em [https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/28971-base-de-faces-de-logradouros-dobrasil.html?=&t=acesso-ao-produto IBGE/base faces de quadra/acesso ao produto]. Descritivo em [https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/28971-base-de-faces-de-logradouros-dobrasil.html?=&t=sobre Sobre a publicação]. [https://www.youtube.com/watch?v=aFluEBKXTCs aula do IBGE para os agentes usando celular]. [https://www.youtube.com/watch?v=rDAQ1Du9pa4 Mais uma boa aula Tanaka]. | |||
Para POA utilizamos esses originais, com download de maio de 2024: | |||
<pre> | |||
3ad3031f5503a4404af825262ee8232cc04d4ea6683d42c5dd0a2f2a27ac9824 4314902_faces_de_logradouros_2021.cpg | |||
e55572718b6bc70f3f32bc58c81cecaf48aa1aebeec313ae20e567e81f3d235d 4314902_faces_de_logradouros_2021.dbf | |||
c9b61f7c5c0d268153118af4183b06d943c1652e94e1201f513a6dcf0ab06567 4314902_faces_de_logradouros_2021.prj | |||
de05db0b048dab811c900c28f6bde2c77f9e3d277011c03801390d20ef838a51 4314902_faces_de_logradouros_2021.shp | |||
2c83a1e2f6c69e1ea331d59166dc2ff612206e42e7511a5bddc2d1fe2df9d07f 4314902_faces_de_logradouros_2021.shx | |||
</pre> | |||
Falta conferir se usamos mesmo a fonte mais atual no DL Digital-guard. Conferir com https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/28971-base-de-faces-de-logradouros-do-brasil.html | |||
Resumo das explicações [https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/28971-base-de-faces-de-logradouros-do-brasil.html?=&t=sobre na aba "Sobre"]. | |||
<pre> | <pre> | ||
Linha 40: | Linha 60: | ||
Por cidade temos [https://www.ibge.gov.br/estatisticas/downloads-estatisticas.html?caminho=Cadastro_Nacional_de_Enderecos_para_Fins_Estatisticos/Censo_Demografico_2022/Arquivos_CNEFE/Municipio Censo_Demografico_2022/Arquivos_CNEFE/Municipio], direto latLong em srid=4326. | Por cidade temos [https://www.ibge.gov.br/estatisticas/downloads-estatisticas.html?caminho=Cadastro_Nacional_de_Enderecos_para_Fins_Estatisticos/Censo_Demografico_2022/Arquivos_CNEFE/Municipio Censo_Demografico_2022/Arquivos_CNEFE/Municipio], direto latLong em srid=4326. | ||
Pelo cabeçalho podemos copiar para uma tabela texto, | Esta [https://www.ibge.gov.br/estatisticas/sociais/populacao/38734-cadastro-nacional-de-enderecos-para-fins-estatisticos.html?edicao=40122&t=resultados página dá acesso ao Excel de descrição, "Dicionário"]. Pelo cabeçalho podemos copiar para uma tabela texto, depois testar se a algumas converções de tipo são válidas. | ||
<pre> | <pre> | ||
Linha 123: | Linha 143: | ||
sqrt(avg(st_area(ST_GeomFromGeoHash(ghs10),true))) as ghs10_precisao | sqrt(avg(st_area(ST_GeomFromGeoHash(ghs10),true))) as ghs10_precisao | ||
from vw02_ibge_cnefe2022 | from vw02_ibge_cnefe2022 | ||
; -- 4.437 ~ 5 metros de precisão no Geohash de 9 dígitos. 0.7844 ~ 1 metro no de 10 dígitos. | ; -- ghs9_precisao = 4.437 ~ 5 metros de precisão no Geohash de 9 dígitos. | ||
-- ghs10_precisao = 0.7844 ~ 1 metro no Geohash de 10 dígitos. | |||
-- select round(100.0*x/762239) perc_x_of_n; | -- select round(100.0*x/762239) perc_x_of_n; | ||
select compl1, count(*) n_casos FROM ( | select compl1, count(*) n_casos FROM ( | ||
select | select ghs9, array_agg(distinct nom_comp_elem1) compl1 from vw02_ibge_cnefe2022 group by 1 having count(*)>1 | ||
) t group by 1 order by 2 desc, 1; | ) t group by 1 order by 2 desc, 1; | ||
select compl, count(*) n_casos FROM ( | |||
select ghs10, array_agg(distinct coalesce(nom_comp_elem1,'')||coalesce(' '||nom_comp_elem2,'')) compl from vw02_ibge_cnefe2022 group by 1 having count(*)>1 | |||
{ | ) t group by 1 order by 2 desc, 1limit 10; | ||
{ | compl | n_casos | ||
{CASA} | -----------------------+--------- | ||
{FRENTE,FUNDOS} | {APARTAMENTO} | 15620 | ||
{""} | 6945 | |||
{BLOCO} | {CASA} | 5642 | ||
{FUNDOS | {FRENTE,FUNDOS} | 4616 | ||
{ | {"BLOCO APARTAMENTO"} | 3694 | ||
{FUNDOS} | {"",FUNDOS} | 1285 | ||
{SOBRADO,TERREO} | {"",CASA} | 1231 | ||
{ | {FUNDOS} | 877 | ||
{SOBRADO,TERREO} | 821 | |||
{"",FRENTE} | 349 | |||
total | 41080 = 5.4% de 762239; ou 10.6% de 389028. | |||
</pre> | </pre> | ||
{|class="wikitable"| | {|class="wikitable"| | ||
|- | |- | ||
Linha 166: | Linha 186: | ||
* Identificadores únicos: era esperada a unicidade em 100% dos registros, ou seja, que ''n''=''n_cod_uend''. Houve, todavia, uma diferença de 0,6% (100% - 99,4%), devido a casos de repetição. O valor de contagens superiores a 1 resultou em média de 2,01±0,07; portanto maioria dos 9433 identificadores problemáticos tem apenas mais 1 outro domicílio apresentando mesmo identificador. | * Identificadores únicos: era esperada a unicidade em 100% dos registros, ou seja, que ''n''=''n_cod_uend''. Houve, todavia, uma diferença de 0,6% (100% - 99,4%), devido a casos de repetição. O valor de contagens superiores a 1 resultou em média de 2,01±0,07; portanto maioria dos 9433 identificadores problemáticos tem apenas mais 1 outro domicílio apresentando mesmo identificador. | ||
* A contagem de ''n_latlon'', com apenas 51% ao invés de 100%, mostra a intensão do IBGE em incluir nos registros os casos de endereço horizontais iguais porém com complemento diferenciando, o que se confirma pelas contagens no perfil de '' | * A contagem de ''n_latlon'', com apenas 51% ao invés de 100%, mostra a intensão do IBGE em incluir nos registros os casos de endereço horizontais iguais porém com complemento diferenciando, o que se confirma pelas contagens no perfil dos complementos (vide amostragem ''compl1'' e ''compl2'' em ~11% dos casos de ''n_latlon''). A rigor o IBGE registrou "endereços domicíliares", não apenas "endereços de rua". Neste relatório denominaremos o primeiro de domicílio ('''dom''') e o segundo de endereço de fato ('''end''') ou ponto. | ||
* A escolha entre Geohashes de 9 ou 10 metros dependeria da precisão média dos pontos do IBGE. Como demonstra a nuvem de pontos, é bastante | |||
* A contagem de ''n_ghs9'' fez uso de Geohashes de 9 dígitos, garantindo a precisão da ordem de 5 metros, ou seja, superior ao erro de GPS da núvem de pontos. A contagem ''n_ghs9'' resultou em 46%, bem longe dos 51% de ''n_latlon'', gerando talvez duplicidade maior do que esperada. Como a precisão é variável (depende dos satélites GPS e do [https://www.youtube.com/watch?v=AVW40YB3v2s tempo de espera do agente]), sugere-se usar ''ghs10'' ou manter o ponto original e só depois do translado para a face de quadra (que aumenta a precisão) fazer a contagem de Geohashes ''ghs10''. | * A contagem de ''n_ghs9'' fez uso de Geohashes de 9 dígitos, garantindo a precisão da ordem de 5 metros, ou seja, superior ao erro de GPS da núvem de pontos. A contagem ''n_ghs9'' resultou em 46%, bem longe dos 51% de ''n_latlon'', gerando talvez duplicidade maior do que esperada. Como a precisão é variável (depende dos satélites GPS e do [https://www.youtube.com/watch?v=AVW40YB3v2s tempo de espera do agente]), sugere-se usar ''ghs10'' ou manter o ponto original e só depois do translado para a face de quadra (que aumenta a precisão) fazer a contagem de Geohashes ''ghs10''. | ||
Linha 188: | Linha 209: | ||
<pre> | <pre> | ||
-- por pontos únicos | -- por pontos únicos em ghs9 | ||
with t as (select | with t as (select count(distinct ghs9||nv_geo_coord) ntpt from vw02_ibge_cnefe2022) select nv_geo_coord, count(distinct ghs9) n_ghs9s, round(100.0*count(distinct ghs9)/t.ntpt,2)::text||'%' as perc from t,vw02_ibge_cnefe2022 group by 1,ntpt order by 1; | ||
</pre> | </pre> | ||
{|class="wikitable"| | {|class="wikitable"| | ||
|- | |- | ||
! nv_geo_coord !! | ! nv_geo_coord !! n_ghs9s !! perc | ||
|- | |- | ||
| 1 = Endereço - coordenada original do Censo 2022 || 343098 || | | 1 = Endereço - coordenada original do Censo 2022 || 343098 || 95.84% | ||
|- | |- | ||
| 2 = Endereço - coordenada modificada (apartamentos em um mesmo número no logradouro). || 11224 || 3. | | 2 = Endereço - coordenada modificada (apartamentos em um mesmo número no logradouro). || 11224 || 3.14% | ||
|- | |- | ||
| 3 = Endereço - coordenada estimada (endereços originalmente sem coordenadas ou coordenadas inválidas). || 2865 || 0. | | 3 = Endereço - coordenada estimada (endereços originalmente sem coordenadas ou coordenadas inválidas). || 2865 || 0.80% | ||
|- | |- | ||
| 4 = Face de quadra. || 798 || 0. | | 4 = Face de quadra. || 798 || 0.22% | ||
|- | |- | ||
| 5 = Localidade || 3 || 0.00% | | 5 = Localidade || 3 || 0.00% | ||
Linha 209: | Linha 230: | ||
Conclusão: como queremos filtrar até o nível de pontos únicos, há garantia de 99,9% dos endereços em condição adequada (tipos 1 ou 2). | Conclusão: como queremos filtrar até o nível de pontos únicos, há garantia de 99,9% dos endereços em condição adequada (tipos 1 ou 2). | ||
=== Filtragens === | |||
As filtragens seguem o seguinte passo a passo: | As filtragens seguem o seguinte passo a passo: | ||
edições