4
edições
(3 revisões intermediárias por um outro usuário não estão sendo mostradas) | |||
Linha 14: | Linha 14: | ||
Os dados brutos (fontes originais), por serem arquivos grandes e de baixa demanda, são mantidos em "discos frios" e armazenamento externo seguro. Seus metadados, todavia, são mantidos no ''git'' da respectiva jurisdição. | Os dados brutos (fontes originais), por serem arquivos grandes e de baixa demanda, são mantidos em "discos frios" e armazenamento externo seguro. Seus metadados, todavia, são mantidos no ''git'' da respectiva jurisdição. | ||
O [https://en.wikipedia.org/wiki/Web_Feature_Service padrão WFS] equivale a um "''download'' fresquinho a todo momento", e garante a coleta padronizada das colunas desejadas (já filtradas), mesmo depois de alterações no servidor de origem. | === Coleta persistente === | ||
Em situação de coleta periódica há garantia de atualização, através de um ''Service Level Agreement'' (SLA) implícito ou explicito, e através de uma API padronizada. O [https://en.wikipedia.org/wiki/Web_Feature_Service padrão WFS] equivale a um "''download'' fresquinho a todo momento", e garante a coleta padronizada das colunas desejadas (já filtradas), mesmo depois de alterações no servidor de origem. | |||
A maturidade digital de uma fonte primária depende da sua capacidade de se atualizar periodicamente e sem custo, ou seja, através de padrões tais como WFS. Apesar de não serem alvo original da AddressForAll, o assunto foi retomado na [https://github.com/digital-guard/preserv-BR/issues/186 ''issue'' #186 do Preserv-BR]. Características: | |||
* Tem um [[wikipedia:Persistent uniform resource locator|URL Persistente]] (PURL) confiável, dispensando a preservação digital periódica (apenas amostras de valor jurídico para a licença). | |||
* Tem uma API padronizada, tipicamente WFS. | |||
* Oferece um SLA para a estimativa consistente de "período de recoleta". | |||
PS: tecnicamente a coleta periódica, por exemplo [[Openaddressess.io]], pode ser implementada com [[dg:Guia do make conf|make_conf]], o inverso é que não é válido. | |||
=== Coleta efêmera === | === Coleta efêmera === | ||
São eventos que dependem da iniciativa de alguém "solicitar e buscar os dados", tipicamente por e-mail. No caso de oferta via Web, na situação de "coleta efêmera" não há garantia de durabilidade do ''endpoint'' nem do padrão estrutural adotado. | São eventos que dependem da iniciativa de alguém "solicitar e buscar os dados", tipicamente por e-mail. No caso de oferta via Web, na situação de "coleta efêmera" não há garantia de durabilidade do ''endpoint'' nem do padrão estrutural adotado. | ||
A maior parte dos dados brutos obtidos pela AddressForAll foram advindos de coleta efêmera. Ainda assim existe o pontencial de recorrência, do doador repetir doações com dados mais atualizados e dentro do mesmo esquema. Com voto de confiança nos doadores e seu pontencial de recorrência a AddressForAll instituiu o [[dg:Guia do make conf|make_conf]], que garante a simplicidade e baixo custo de repetição dos eventos de coleta efêmera. Características: | |||
* Não tem ''endpoint'' ou, quando existe, não é um [[wikipedia:Persistent uniform resource locator|URL Persistente]] (PURL) confiável, requerendo preservação digital de cada coleta (para garantia de reprodutibilidade da comprovação jurídica da licença). | |||
* Não tem API ou download padronizado, tipicamente e-mail. | |||
* Não oferece um SLA para coleta periódica, nem sequer para a próxima coleta. | |||
== Repositórios de produtos == | == Repositórios de produtos == |
edições