Ir para o conteúdo

CNEFE: mudanças entre as edições

Linha 80: Linha 80:
);
);
copy ibge_cnefe2022 from '/tmp/POA_FACES/4314902_PORTO_ALEGRE.csv' with  (format CSV, delimiter ';', header);
copy ibge_cnefe2022 from '/tmp/POA_FACES/4314902_PORTO_ALEGRE.csv' with  (format CSV, delimiter ';', header);
----
drop view if exists vw02_ibge_cnefe2022;
create view vw02_ibge_cnefe2022 as
select *, regexp_replace( coalesce(nom_tipo_seglogr,'') || ' '||  coalesce(nom_titulo_seglogr,'') ||' '|| coalesce(nom_seglogr,''), '\s+', ' ', 'g') as via_name,
ST_SetSRID(ST_MakePoint(longitude::float, latitude::float),4326) as geom
from ibge_cnefe2022;
select count(*) from ibge_cnefe2022; -- 762239
select count(*) from (select distinct ST_GeoHash(geom,9) as ghs, cod_setor, num_quadra, num_face, via_name, num_endereco
from vw02_ibge_cnefe2022 -- same where geom is not null and via_name>'' and num_endereco>''         
) t; -- 379957
select 379957.0/762239; -- 49,847% = 50%
</pre>
</pre>
Só na redução de pontos para 50% já é bem drástica, provavelmente inclui casos que diferenciam apenas no complemento.
Falta eliminar mesmo ponto e mesmo endereço/CEP.
2 402

edições