a4a:Consolidação

Revisão de 21h42min de 5 de fevereiro de 2024 por Peter (discussão | contribs) (→‎Brasil: add consolidadas)

Rascunho para decisões de reunião

Brasil

Mais detalhes em a4a:Consolidação/Perfil das cidades-piloto

Cidades-piloto para os testes de algoritmos e homologações, em ordem de prioridade:

  • Jundiaí: tem dados SocialMe
  • São Bento do Sapucaí: terá acesso a dados de campo
  • Nova Friburgo: proximidade com a prefeitura
  • Boa vista: proximidade com a prefeitura
  • Cidades com dados consolidados, passaram na curadoria:
isolabel_ext n n_house_num n_via_name n_cep
BR-CE-Fortaleza 374580 364107 374580 0
BR-MG-BeloHorizonte 690656 690656 690654 0
BR-MG-Contagem 94572 81871 94570 0
BR-SP-Jundiai 105006 82066 104862 104913

Fontes disponíveis

Mais detalhes em a4a:Consolidação/Perfil das fontes

A principal fonte, oficial e atualizada, é o IBGE:

  • Pontos de fevereiro de 2024, com promessa de se tornarem endereços (ainda esse ano?)
  • CNEFE - Cadastro Nacional de Endereços para Fins Estatísticos, pré-Censo com faces de quadra e endereços completos. Dados de 2021.
  • Censo rural de 2017
  • DNE - Correios
  • OSM - pontos de endereço fiáveis
  • OSM - ruas, jurisdições, etc. Nosso substrato.
  • Prefeituras

Metodologia, parte 1

Carga: a cada cidade-piloto, reunir todos os dados das respectivas fontes

Referência: dados de totais do IBGE e outras fontes (ex. Correios), para quantificar metas de totas. Número total de domicílios, estimativa número de lotes não-domiciliares, estimativa de total de lotes, total de ruas, total de estradas, área total, área urbana, área rural, etc.

Carga vs referência: comparar sumarizações diretas dos objetos com os dados de referência.

Análise de qualidade e das discrepâncias:

  • Análise dos casos onde "carga vs referência" se mostraram muito discrepantes
  • Análise de gaps: avaliar a o "branco" de nomes de rua, de numeração predial, de pontos, etc. podem inviabilizar a cidade.
  • Análise visual: no QGIS (Igor)
    • para eventualmente explicar alguns gaps e discrepâncias
    • para controle de qualidade de cada layer disponível, primeiro parecer (indicando eventuais demandas por correção)

Metodologia, parte 2

Passo a passo dos tratamentos e algoritmos de consolidação... Decidir se começa levantando dados completos e confiáveis, ou se começa com IBGE... Sugiro começar com:

  • Curadoria dos pontos OSM: endereços confiáveis e eventualmente "corrigíveis".
  • Pontos de referência geodésica na cidade: necessária confirmação com imagens de satélite utilizadas pelo OSM, necessária comparação com Google (discrepante? mais que OSM?).
  • Curadoria das vias OSM: avaliar qualidade e comparar com Google
    • Correção das vias OSM, ou decisão de "abandonar a cidade"
  • Ajuste das faces de quadra com base em IBGE e vias OSM.