Organizando os dados abertos

Augusto Herrmann
2.12.2022

o que é "aberto"?

O que qualquer pessoa pode acessar, usar, modificar e compartilhar para qualquer finalidade. (opendefinition.org)

o que significa

  • dados abertos?
  • transparência?
  • conhecimento aberto?
  • open access?
  • ciência aberta?
  • software livre?

o que queremos publicar?

  • documentos (papers, relatórios, etc.)
  • datasets (tabelas, grafos, corpus de texto, bancos de imagens)
  • códigos (programas de computador, scripts)

documentos

  • Licenças: ex.: Creative Commons 4.0 Atribuição, CC-Zero
  • Repositórios: bibliotecas digitais (ex.: DSpace)

datasets

  • Licenças: ex.: Creative Commons 4.0 Atribuição, CC-Zero, ODbL
  • Repositórios: catálogos de dados (ex.: CKAN, uData, DKAN, Zenodo)

códigos

  • Licenças: ex.: GPL v3, Affero GPL, MIT, Apache, etc.
  • Repositórios: repositórios (ex.: GitLab, Kallithea, Github)

Para quê?

  • software de catálogo de dados mais usado no mundo para portais de dados abertos (dataportals.org)
  • alguns usam para catalogar bases de dados (ex.: GovData)
  • alguns usam para catalogar documentos

Histórico

  • usado no data.gov e data.gov.uk em 2009
  • tradução para português em 2009
  • usado no dados.gov.br em 2011
  • evolução recente:
    • Python 2.x para Python 3.x
    • Pylons para Flask
  • pesquisas para a versão 3.0
    • Alex Gostev e entrevistas