Ir para o conteúdo

dg:Sobre: mudanças entre as edições

3 435 bytes adicionados ,  30 de abril de 2023
sem sumário de edição
Sem resumo de edição
Sem resumo de edição
Linha 1: Linha 1:
Página que descreve o projeto [[Documentação Digital-guard|Digital-guard]], seus produtos e serviços.
Página que descreve o projeto [[Documentação Digital-guard|Digital-guard]], seus produtos e serviços.
Original: https://github.com/digital-guard/preserv/blob/main/README.md
----
<!-- olds digGuard-logoSmall.180px.png  icon-DigitalGuard-transp2.262px.png--><img align="right" src="docs/assets/icon-DigitalGuard3.180px.png">
== Preserv ==
O presente projeto, batizado de '''Digital-guard/Preserv''', consiste no núcleo de software e metadados do projeto de [https://en.wikipedia.org/wiki/Digital_preservation preservação digital] de fontes primárias de dados, organizados e mantidos pelo [http://addressforall.org/estatuto '''Instituto ITGS'''].
=== Preservação dos dados primários ===
A responsabilidade sobre os dados é dividida entre o Instituto ITGS e a curadoria local de uma jurisdição, tipicamente um país. A jurisdição <code>BR</code>, por exemplo, é relativa ao Brasil e seu repositório ''git'' é o [http://git.digital-guard.org/preserv-BR preserv-BR].
As ''curadorias locais'' selecionam quais dados devem ser preservados e quais os critérios mínimos de qualidade para que um pacote de dados possa ser incorporado ao acervo de preservação.
Os dados brutos (fontes originais), por serem arquivos grandes e de baixa demanda, são mantidos em &quot;discos frios&quot; e armazenamento externo seguro. Seus metadados, todavia, são mantidos no ''git'' da respectiva jurisdição.
=== Repositórios de produtos ===
Os dados de diversas fontes são comparados estatisticamente e consolidados pela infraestrutura do Instituto ITGS. Os resultados finais da consolidação são dados confiáveis, oferecidos ao público como &quot;versão teste&quot; (''testing'') e &quot;versão estável&quot; (''stable''). São de responsabilidade apenas do Instituto, mas o controle de versões é mantido com a mesma divisão de jurisdições que as fontes.
As versões ''stable'' são mantidas em repositórios ''git'' atualizados periodicamente. Eventualmente os repositórios ''git'' serão segmentados em biênios ou triênios, conforme volume de dados e atualização da jurisdição, evitando sobrecarga do ''git''. Os repositórios recebem nomes com a sintaxe <code>digital-preservation-{jurisdição}-stable{anoInicial}</code>. Por exemplo <code>digital-preservation-BR-stable2020</code> é o ''git'' de preservação dos produtos estáveis da jurisdição Brasil iniciado em 2020.
=== Operando as eclusas de entrega de dados ===
A cada curadoria local existe um ou mais ''técnicos responsáveis'' que justamente assumem a responsabilidade pela integridade dos dados e dão a garantia de que os dados e metadados fornecidos são consistentes e tem origem numa doação de dados realizada pela entidade detentora dos direitos de uso, e portanto cessionária da licença de uso aberta que acompanha os dados.
Os metadados garantem a rastreabilidade tanto da fonte como da licença fornecida. São metadados de [https://en.wikipedia.org/wiki/Provenance#Data_provenance proveniência], conforme a estrutura ilustrada abaixo:
[[File:docs/assets/packModel.png]]
A entrega de dados brutos pode ser realizada arquivo por arquivo ou &quot;em lote&quot;, ambas pelo ''técnico responsável'' devidamente autenticado. A entrega em lote é realizada por protocolo SFTP, no ambiente apelidado de Eclusa.
<img align="right" src="docs/assets/eclusa123-ico.200x.png">
Todo o workflow e garantia de geração de ''hash'' é efetuado pela Eclusa.
=== Códigos-fonte da Eclusa e demais softwares ===
Ver [[src|/src]].
[[Categoria:Digital-guard]]
[[Categoria:Digital-guard]]
1 224

edições