to data dictionary document with fastETL's DocumentTemplateToDataDictionaryOperator
TaxiGov: open data publication
Using open data with Frictionless
In [1]: from frictionless import Package
In [2]: package = Package("https://repositorio.dados.gov.br/seges/taxigov/v2/datapackage.yaml")
In [3]: package.resource_names
Out[3]:
['corridas-7-dias',
'passageiros-solicitantes',
'corridas',
'corridas-2017',
'corridas-2018',
'corridas-2019',
'corridas-2020',
'corridas-2021',
'corridas-2022',
'corridas-2023']
In [4]: df = package.get_resource("passageiros-solicitantes").to_pandas()
In [5]: df[df["nome_passageiro"].str.upper().str.startswith("AUGUSTO HERRMANN") == True]
Out[5]:
base_origem nome_passageiro nome_solicitante cpf_solicitante ano mes distancia valor quantidade
105925 TAXIGOV_DF_1 AUGUSTO HERRMANN BATISTA AUGUSTO HERRMANN BATISTA ***.303.276-** 20181130.735125.654111136 TAXIGOV_DF_1 AUGUSTO HERRMANN BATISTA AUGUSTO HERRMANN BATISTA ***.303.276-** 20181026.61597.503115336 TAXIGOV_DF_1 AUGUSTO HERRMANN BATISTA AUGUSTO HERRMANN BATISTA ***.303.276-** 2018935.175125.074134833 TAXIGOV_DF_1 AUGUSTO HERRMANN BATISTA AUGUSTO HERRMANN BATISTA ***.303.276-** 2018533.043112.873143470 TAXIGOV_DF_1 AUGUSTO HERRMANN BATISTA AUGUSTO HERRMANN BATISTA ***.303.276-** 2018349.065173.815