dg:Sobre: mudanças entre as edições

De Documentação
mSem resumo de edição
mSem resumo de edição
Linha 7: Linha 7:
O presente projeto, batizado de '''Digital-guard/Preserv''', consiste no núcleo de software e metadados do projeto de [https://en.wikipedia.org/wiki/Digital_preservation preservação digital] de fontes primárias de dados, organizados e mantidos pelo [http://addressforall.org/pt/statutes/ '''Instituto ITGS'''].
O presente projeto, batizado de '''Digital-guard/Preserv''', consiste no núcleo de software e metadados do projeto de [https://en.wikipedia.org/wiki/Digital_preservation preservação digital] de fontes primárias de dados, organizados e mantidos pelo [http://addressforall.org/pt/statutes/ '''Instituto ITGS'''].


=== Preservação dos dados primários ===
== Preservação dos dados primários ==


A responsabilidade sobre os dados é dividida entre o Instituto ITGS e a curadoria local de uma jurisdição, tipicamente um país. A jurisdição <code>BR</code>, por exemplo, é relativa ao Brasil e seu repositório ''git'' é o [http://git.digital-guard.org/preserv-BR preserv-BR].
A responsabilidade sobre os dados é dividida entre o Instituto ITGS e a curadoria local de uma jurisdição, tipicamente um país. A jurisdição <code>BR</code>, por exemplo, é relativa ao Brasil e seu repositório ''git'' é o [http://git.digital-guard.org/preserv-BR preserv-BR].
Linha 14: Linha 14:


Os dados brutos (fontes originais), por serem arquivos grandes e de baixa demanda, são mantidos em "discos frios" e armazenamento externo seguro. Seus metadados, todavia, são mantidos no ''git'' da respectiva jurisdição.
Os dados brutos (fontes originais), por serem arquivos grandes e de baixa demanda, são mantidos em "discos frios" e armazenamento externo seguro. Seus metadados, todavia, são mantidos no ''git'' da respectiva jurisdição.
=== Coleta periódica ===
A maturidade digital de uma fonte primária depende da sua capacidade de se atualizar periodicamente e sem custo, ou seja, através de padrões tais como WFS.  Apesar de não serem alvo original da AddressForAll, o assunto foi retomado na [https://github.com/digital-guard/preserv-BR/issues/186 ''issue'' #186 do Preserv-BR].


=== Repositórios de produtos ===
=== Coleta efêmera ===
 
== Repositórios de produtos ==


Os dados de diversas fontes são comparados estatisticamente e consolidados pela infraestrutura do Instituto ITGS. Os resultados finais da consolidação são dados confiáveis, oferecidos ao público como &quot;versão teste&quot; (''testing'') e &quot;versão estável&quot; (''stable''). São de responsabilidade apenas do Instituto, mas o controle de versões é mantido com a mesma divisão de jurisdições que as fontes.
Os dados de diversas fontes são comparados estatisticamente e consolidados pela infraestrutura do Instituto ITGS. Os resultados finais da consolidação são dados confiáveis, oferecidos ao público como &quot;versão teste&quot; (''testing'') e &quot;versão estável&quot; (''stable''). São de responsabilidade apenas do Instituto, mas o controle de versões é mantido com a mesma divisão de jurisdições que as fontes.
Linha 28: Linha 32:


[[Arquivo:Dg-PackModel.png|centro|semmoldura|480x480px]]
[[Arquivo:Dg-PackModel.png|centro|semmoldura|480x480px]]


A entrega de dados brutos pode ser realizada arquivo por arquivo ou &quot;em lote&quot;, ambas pelo ''técnico responsável'' devidamente autenticado. A entrega em lote é realizada por protocolo SFTP, no ambiente apelidado de Eclusa.
A entrega de dados brutos pode ser realizada arquivo por arquivo ou &quot;em lote&quot;, ambas pelo ''técnico responsável'' devidamente autenticado. A entrega em lote é realizada por protocolo SFTP, no ambiente apelidado de Eclusa.
Linha 36: Linha 38:
[[Arquivo:Eclusa123-ico.png|direita|semmoldura|100x100px]]
[[Arquivo:Eclusa123-ico.png|direita|semmoldura|100x100px]]


=== Códigos-fonte da Eclusa e demais softwares ===
== Códigos-fonte da Eclusa e demais softwares ==


Ver [https://github.com/digital-guard/preserv/blob/main/src src].
Ver [https://github.com/digital-guard/preserv/blob/main/src src].

Edição das 11h03min de 9 de março de 2024

Dg-logo-draft1.png
Documentação integrante do
projeto Digital-guard
Países: AR, BR, CO, CM, CL, PE, SR, VE, UY.


Página que descreve o projeto Digital-guard, seus produtos e serviços.

O presente projeto, batizado de Digital-guard/Preserv, consiste no núcleo de software e metadados do projeto de preservação digital de fontes primárias de dados, organizados e mantidos pelo Instituto ITGS.

Preservação dos dados primários

A responsabilidade sobre os dados é dividida entre o Instituto ITGS e a curadoria local de uma jurisdição, tipicamente um país. A jurisdição BR, por exemplo, é relativa ao Brasil e seu repositório git é o preserv-BR.

As curadorias locais selecionam quais dados devem ser preservados e quais os critérios mínimos de qualidade para que um pacote de dados possa ser incorporado ao acervo de preservação.

Os dados brutos (fontes originais), por serem arquivos grandes e de baixa demanda, são mantidos em "discos frios" e armazenamento externo seguro. Seus metadados, todavia, são mantidos no git da respectiva jurisdição.

Coleta periódica

A maturidade digital de uma fonte primária depende da sua capacidade de se atualizar periodicamente e sem custo, ou seja, através de padrões tais como WFS. Apesar de não serem alvo original da AddressForAll, o assunto foi retomado na issue #186 do Preserv-BR.

Coleta efêmera

Repositórios de produtos

Os dados de diversas fontes são comparados estatisticamente e consolidados pela infraestrutura do Instituto ITGS. Os resultados finais da consolidação são dados confiáveis, oferecidos ao público como "versão teste" (testing) e "versão estável" (stable). São de responsabilidade apenas do Instituto, mas o controle de versões é mantido com a mesma divisão de jurisdições que as fontes.

As versões stable são mantidas em repositórios git atualizados periodicamente. Eventualmente os repositórios git serão segmentados em biênios ou triênios, conforme volume de dados e atualização da jurisdição, evitando sobrecarga do git. Os repositórios recebem nomes com a sintaxe digital-preservation-{jurisdição}-stable{anoInicial}. Por exemplo digital-preservation-BR-stable2020 é o git de preservação dos produtos estáveis da jurisdição Brasil iniciado em 2020.

Operando as eclusas de entrega de dados

A cada curadoria local existe um ou mais técnicos responsáveis que justamente assumem a responsabilidade pela integridade dos dados e dão a garantia de que os dados e metadados fornecidos são consistentes e tem origem numa doação de dados realizada pela entidade detentora dos direitos de uso, e portanto cessionária da licença de uso aberta que acompanha os dados.

Os metadados garantem a rastreabilidade tanto da fonte como da licença fornecida. São metadados de proveniência, conforme a estrutura ilustrada abaixo:

Dg-PackModel.png

A entrega de dados brutos pode ser realizada arquivo por arquivo ou "em lote", ambas pelo técnico responsável devidamente autenticado. A entrega em lote é realizada por protocolo SFTP, no ambiente apelidado de Eclusa.

Todo o workflow e garantia de geração de hash é efetuado pela Eclusa.

Eclusa123-ico.png

Códigos-fonte da Eclusa e demais softwares

Ver src.

Ligações externas