Augusto Herrmann

 Blog posts

Meu primeiro código Python, 14 anos depois

Post cover image

Ao folhear alguns de meus backups antigos, me deparei com algumas das primeiras coisas que eu escrevi em Python. Foi em 2007, enquanto eu cursava a graduação em Matemática Computacional, que eu estudei fundamentos de criptografia na universidade com o professor Dr. Jeroen van de Graaf, no Departamento de Ciência da Computação da Universidade Federal de Minas Gerais. Para os exercícios de aprendizagem, nós precisávamos fazer cálculos com grandes números inteiros, algo que não era simples de se fazer em muitas das linguagens de programação da época. O Prof. Jeroen sugeriu que usássemos Python para isso, o que acabou facilitando muito traduzir em código executável os algoritmos abstratos dos livros. Nós usamos muitos livros sobre teoria dos números e criptografia,…

read more

Por que eu discordo do Discord, ou como escolher alternativas com melhores termos de serviço

Post cover image

Por mais de um ano estamos vivendo em uma pandemia. Aqueles de nós que podemos, evitamos sair de casa enquanto pudermos. O sentimento subsequente de isolamento e a necessidade de se conectar com os outros nos leva a utilizar os serviços online cada vez mais, o que leva aplicativos como o Zoom e o Google Meet a ter um crescimento vertiginoso. O mesmo também ocorreu com aplicações de bate papo em grupo com áudio/vídeo como o Discord. Todo mundo por aí está ou criando uma nova comunidade online no Discord (estranhamente chamadas “servidores”, embora não sejam servidores em um sentido estritamente técnico (internamente eles são chamados “guildas”, de acordo com este fio no Reddit)), ou migrando para o Discord suas…

read more

Dados Abertos em perspectivas: um relato do Open Data Day 2020 no Arquivo Nacional

Post cover image

Há um ano eu estava em um dos dois eventos do Open Data Day no Rio de Janeiro, que foi organizado pelo Arquivo Nacional. O evento aconteceu um dia antes, na sexta-feira, levando em consideração que o Open Data Day é sempre em um sábado, pois assim funcionaria melhor para a instituição organizar um evento em um dia útil. Eu fui convidado para palestrar lá sobre o próprio Open Data Day: o que ele é, por que é importante e como foram alguns dos eventos do ODD anteriores. As outras palestras no evento também mostraram outras perspectivas sobre os dados abertos. Otávio Neves, Diretor de Transparência e Prevenção da Corrupção na Controladoria-Geral da União (CGU) mostrou a direção atual da…

read more

Como construir um ambiente personalizado para o Jupyter no Docker

Post cover image

Se você tem desenvolvido software nos últimos anos, você provavelmente teve algum contato com o uso de containers não apenas para fazer o deploy, mas também durante o desenvolvimento para ter certeza de que o seu ambiente é totalmente reproduzível em sistemas diferentes. Também é muito popular nos meios de ciência de dados, visualização de dados e outros relacionados usar Python e Jupyter Notebooks e Jupyter Lab para explorar e experimentar com os dados. Algumas pessoas criticam o Jupyter por frequentemente resultar em trabalhos não reproduzíveis, algo muito importante para o método científico, pois o ambiente de desenvolvimento pode ser diferente daquele que o vai reproduzir e as células podem ser executadas fora de ordem. Por exemplo, em um experimento…

read more

Como tratar dados com formatação internacional no Python

Post cover image

Um inconveniente frequente ao tratar dados de diversas fontes internacionais é como lidar com as diferenças entre as várias línguas e culturas representam os seus separadores decimais e de milhares, a ordem de ano, mês e dia nas datas, etc. Muitos países vão da menor (dia) à maior (ano) unidade de tempo, enquanto que alguns, como os E.U.A., fazem a coisa estranha que é começar no meio (mês), então ir para o menor (dia) e enfim inverter completamente a direção e ir para a maior unidade (ano). Se você olhar para os separadores decimais, parece que mais ou menos a metade do mundo usa pontos e a outra metade usa vírgulas. O separador de milhares é o outro marcador. Isto…

read more

Por que ainda chamamos o Facebook de plataforma? O que é mesmo uma plataforma?

Post cover image

Enquanto as gigantes de tecnologia estão sob mais escrutínio que nunca, estamos sempre ouvindo a mídia trazer repetidamente a discussão de plataforma vs. editora na imprensa internacional e também por políticos estadunidenses. Como a Electronic Frontier Foundation (EFF) apropriadamente coloca, para efeitos do CDA Seção 230, isso não importa. Como a EFF e outros pensadores da sociedade digital têm argumentado ao longo dos anos, a CDA 230 não faz tal distinção. Uma questão de semântica Mas o que é mesmo uma “plataforma”? Um uso comum por pessoas de fora do campo da tecnologia é usar a palavra para significar somente um lugar no qual as pessoas podem se expressar. Se você tem qualquer site que aceita conteúdo gerado pelo usuário,…

read more

Dados abertos: a retrospectiva de um comitê

Post cover image

A possibilidade de se recriar um comitê de dados abertos no governo federal brasileiro me levou a lembrar e a contar a história do comitê de dados abertos que nós criamos oito anos atrás. Por favor tenha em mente, todavia, que esta não é a história completa da Infraestrutura Nacional de Dados Abertos (INDA), ou mesmo as suas partes mais importantes, mas sim somente a parte que envolve o comitê e os assuntos que foram nele discutidos ao longo dos anos. Inspiração e motivação Em 2011, quando estávamos projetando a política de dados abertos do governo federal brasileiro, um dos desafios que encaramos foi como se certificar que cidadãos e cidadãs tivessem um lugar e pudessem opinar sobre como a…

read more

Como instalar e configurar o CKAN 2.9.0 usando o Docker

Post cover image

Em 2014, fui convidado a fazer dois minicursos de CKAN, sendo um deles na agradável ilha de Florianóplis e o outro no inverno congelante de Moscou. Eu já tinha tido alguma experiência com ele quando criamos colaborativamente o portal de dados abertos dados.gov.br em 2012, mas eu tive que estudá-lo novamente em 2014 para me atualizar com os desenvolvimentos então mais recentes. Augusto apresenta o seu curso de CKAN no IV Fórum Urbano de Moscou em 2014 (créditos da foto: Fórum Urbano de Moscou). Os slides desses minicursos, um em inglês e o outro em português, estão disponíveis no SlideShare: CKAN Overview (apresentado no IV Fórum Urbano de Moscou, em Moscou, em inglês) Minicurso de CKAN (apresentado na conferência Linked…

read more

Cadência e estética: coisas estranhas que moldam artigos de maneiras inesperadas em línguas latinas

Post cover image

Como um aspirante a poliglota e linguista amador, às vezes eu encontro semelhanças curiosas entre regras gramaticais em idiomas diferentes. Uma, em particular, frequentemente surpreende estudantes quando eles a encontram pela primeira vez, especialmente se o seu idioma nativo não tiver algo assim (por exemplo, o português) ou se nem mesmo tiver artigos (como é o caso de muitas línguas eslavas, como o russo). Quando se aprende outras línguas, uma das primeiras coisas que se aprende é que os substantivos muitas vezes têm um gênero diferente do respectivo na sua língua natal. Então você precisa memorizar o gênero dos substantivos e praticar muito. Também se aprende que é preciso usar os artigos, os pronomes e frequentemente os adjetivos de acordo…

read more

Um padrão simples de refatoração em Python: substituir tratamento especial em listas

Post cover image

Quando nos descobrimos a repetir o mesmo código ou similar em vários lugares nos nossos arquivos, sabemos que é hora de refatorá-lo. Caso contrário ele se torna difícil de manter a longo prazo e acumula dívida técnica. se você perceber um monte de ifs espalhados pelo código para tratar casos especiais, dependendo dos valores dos itens de uma lista, então uma possível refatoração simples poderia ser assim. Só para tomar um exemplo, suponha que você tenha uma lista de itens. Por exemplo, uma lista de cidades ao redor do mundo. Elas poderiam ser possíveis destinos para onde você poderia enviar alguns produtos. In [1]: cidades = [ ‘Manaus’, ‘Belém’, ‘Recife’, ‘Maceió’, ‘Salvador’, ‘Belo Horizonte’, ‘Brasília’, ‘Rio de Janeiro’, ‘São Paulo’,…

read more

É 2020. Por que você ainda não está abrindo dados? Bingo!

Post cover image

Quando eu comecei a defender a ideia e construir dados abertos onze anos atrás, o mundo era um lugar muito diferente. O Brasil não tinha nem um portal de dados abertos, nem uma política para isso. Até os países que foram pioneiros na agenda dos dados abertos estavam apenas começando. Agora podemos ver uma paisagem muito diferente. A maioria dos países Now we can see a very different landscape. Most nation states have se uniram à agenda dos dados abertos e disponibilizam um portal único onde as pessoas podem baixar uma miríade de dados sobre quase qualquer assunto, incluindo os mais importantes. Muitos governos locais o fazem, também. Pode parecer que os gestores do setor público, deste então, em sua…

read more

Sobre o Estado dos Dados Abertos: eles enfrentam uma crise de identidade?

Post cover image

Qual é o estado dos dados abertos ao redor do mundo? Os dados abertos estão enfrentando uma crise de identidade? Essas são algumas das perguntas que um livro recente e o seu evento de lançamento tentam responder. Seis meses atrás, um livro contemplando o estado dos dados abertos ao redor do mundo foi lançado pela iniciativa Open Data for Development (OD4D) (Dados Abertos para o Desenvolvimento). A OD4D é uma parceria global que apoia a liderança do sul e ecossistemas de dados liderados localmente ao redor do mundo como uma maneira de impulsionar mudanças sociais positivas e o desenvolvimento sustentável – site da OD4D (tradução livre) O programa é hospedado pelo International Development Research Centre – IDRC (Centro de Pesquisa…

read more

Cory Doctorow: a DRM quebrou a sua promessa

Post cover image

Dia 12 de outubro, além de no Brasil ser o dia das crianças e dia de Nossa Senhora Aparecida, é também o dia internacional contra a DRM. DRM é um conjunto de práticas e tecnologias que visam restringir o que o consumidor pode fazer com os bens digitais que adquire, conforme o que for ditado pelos detentores dos direitos sobre esses bens. Em alusão a essa data, trago aqui a tradução autorizada de um texto que o autor Cory Doctorow escreveu para a sua coluna na revista Locus, que também está disponível em uma leitura do próprio autor, em inglês, em formato de podcast. Segue o texto. Cory Doctorow: a DRM quebrou a sua promessa Quando os estados tinham estabelecido…

read more

Contando conjuntos de dados tabulares e mapas no CKAN

Post cover image

Veio ao meio conhecimento que alguns sistemas de avaliação internacionais, especiifcamente o Open-Useful-Reusable Government Data (OURdata) Index, medido pela Organização para a Cooperação e Desenvolvimento Econômico (OCDE), medem não apenas quantos conjuntos de dados um dado portal nacional de dados abertos tem, mas também quantos destes são tabulares e quantos são mapas. Não creio que medir o número de conjuntos de dados em um portal de dados abertos governamentais seja uma métrica muito útil, considerando que governos podem muito bem dividir grandes conjuntos de dados em outros menores para obter um maior “número de conjuntos de dados”, sem acrescentar qualquer benefício ou valor para o utilizador dos dados. Pelo contrário, essa prática pode fazer com que dados relevantes se tornem…

read more

Tokens e atribulações

Post cover image

Após quinze anos acompanhando de longe a evolução da Infraestrutura de Chaves Públicas Brasileira – ICP Brasil, enfim, adquiri um certificado próprio. E, com ele, um token em hardware para armazenar a chave privada. Decidi, então tentar instalá-lo e operá-lo em um sistema operacional Ubuntu 18.04.2 LTS e documentar os passos para ajudar outras pessoas que porventura queiram utilizá-lo no mesmo sistema e encontrem dificuldades. Instalando o token usb para certificado digital Para instalar os drivers do token GD Starsign da Giesecke & Devrient GmbH no Ubuntu 18.04.2 LTS, baixe os drivers a partir da página de drivers da GD América do Sul e descompacte os arquivos. Apesar do nome dos drivers serem para dispositivos “Safesign”, eles são compatíveis com…

read more

Anotações do curso: novos avanços em governo aberto e digital

Post cover image

Esta semana, mais uma vez, participamos do curso Novos Avanços em Governo Aberto e Digital. O curso é ministrado pelo Prof. Dr. Marijn Janssen da Delft Technical University nos Países Baixos, e é promovido em Brasília pela Secretaria de Governo Digital – SGD – e a Escola Nacional de Administração Pública – Enap. Esta é a segunda vez que o curso é oferecido, depois de ter estreado em 2018. A maioria dos participantes são servidores públicos de vários órgãos do governo federal. Nesta série de artigos, compartilharei as minhas principais observações e comentários sobre o conteúdo do curso. Note que estas são as minhas próprias percepções e pontos de vista e não representam de maneira alguma as posições e opiniões…

read more