Ciência e Dados
Menu
  • Home
  • Sobre
  • Contato
Menu
O Poder do Open Data

O Poder do Open Data

Posted on 12 de fevereiro de 202027 de dezembro de 2022 by David Matos

Open data (também chamado public datasets) faz parte de uma tendência em direção a um conceito mais amplo sobre o que é propriedade intelectual, uma tendência que tem ganhado enorme popularidade ao longo da última década. Dados abertos são dados que foram disponibilizadas ao público e que podem ser utilizados, reutilizados, analisados e compartilhados com os outros. O open data faz parte de um movimento que inclui software open-source, hardware livre, trabalho criativo de conteúdo aberto, acesso aberto a publicações científicas e a ciência livre – todos comprometidos com a noção de que o conteúdo (incluindo dados brutos obtidos a partir de experimentos) devem ser compartilhados livremente.

A característica que distingue licenças de uso livre, são que elas tenham Copyleft, ao invés de direitos autorais. Com Copyleft, a única restrição é que a fonte do trabalho deve ser identificada, por vezes, com a ressalva de que trabalhos derivados não podem ser protegidos por direitos autorais com uma licença mais restritiva do que o original. Desta forma, comercializar com sucesso o trabalho de origem Copyleft, torna-se difícil, embora seja possível encontrar formas criativas e indiretas de comercialização. Esteja ciente de que, por vezes, mesmo um trabalho rotulado como aberto pode realmente não se encaixar na definição acima. Você é responsável por verificar os direitos de licenciamento e restrições de dados abertos que você utilizar.

As pessoas muitas vezes confundem licenças de uso livre com licenças Creative Commons. Creative Commons é uma organização sem fins lucrativos, dedicada a incentivar e difundir obras criativas, oferecendo um quadro jurídico através do qual as permissões de uso podem ser concedidas e obtidas, de modo que os autores e as pessoas ou empresas que utilizaram os dados, estejam a salvo de riscos legais provenientes do conhecimento presente no material compartilhado livremente. Algumas licenças Creative Commons estão abertas e alguns explicitamente proíbem obras e / ou comercialização de derivados.

Como parte das iniciativas de open data, surgiu o conceito de governo aberto. Os governos de todo o mundo começaram a liberar dados livres para consulta e utilização. Os governos geralmente fornecem esses dados de modo que ele possa ser usado por analistas e cientistas de dados, além de programadores que trabalham em colaboração para construir soluções open-source que utilizam dados abertos para resolver problemas sociais – em um esforço para beneficiar a sociedade em geral. Em 2013, o G8 (França, Estados Unidos, Reino Unido, Rússia, Alemanha, Japão, Itália e Canadá), assinou uma carta comprometendo-se a abrir os dados, priorizando as áreas de estatísticas nacionais, resultados eleitorais, orçamentos governamentais e mapas nacionais. O movimento de um governo aberto promove a transparência e a prestação de contas do governo, nutre um eleitorado bem informado e incentiva a participação do público. Para colocá-lo em termos de computação, um governo aberto facilita uma relação de leitura / gravação entre um governo e seus cidadãos.

Os dados abertos têm outra imensa vantagem. Eles podem ser usados para validar modelos de análise e calibrar algoritmos de Machine Learning. Trabalhando com dados reais, os Cientistas de Dados podem construir seus modelos e validar os resultados, antes de liberar suas aplicações para os usuários finais. Os dados abertos também podem ser usados para complementar os dados obtidos internamente dentro de uma empresa. Os dados internos podem ser usados em conjunto com fontes externas para se obter um resultado final mais completo possível e que mostre a influência do mundo externo nas decisões da empresa e vice-versa. A Open Data Foundation reúne empresas e pessoas interessadas em trabalhar com dados abertos.

Abaixo, algumas fontes de open data bem interessantes:

Dados do Governo do Brasil: http://dados.gov.br/

IPEA: http://www.ipeadata.gov.br

Banco Central do Brasil: BCB

Dados do Governo dos EUA: http://data.gov

Dados sobre as cidades americanas: http://datasf.org

Dados do Governo do Canadá (em inglês e francês): http://open.canada.ca

Dados do Governo do Reino Unido: https://data.gov.uk

Dados da União Europeia: http://open-data.europa.eu/en/data

Dados do Censo dos EUA (dados da população americana e mundial): http://www.census.gov

Dados da NASA: https://data.nasa.gov

Dados do Banco Mundial: http://data.worldbank.org

Dados sobre a saúde: http://www.healthdata.gov

Dados públicos da Amazon: http://aws.amazon.com/datasets

Dados sobre diversos países (incluindo o Brasil): http://knoema.com

Dados sobre diversas áreas de negócio e finanças: https://www.quandl.com

Google Trends: https://www.google.com/trends

Google Finance: https://www.google.com/finance

Gapminder: http://www.gapminder.org/data

Dados sobre milhões de músicas: https://aws.amazon.com/datasets/million-song-dataset

Dados sobre os mais diversos assuntos: http://www.freebase.com

DBpedia: http://wiki.dbpedia.org/

Open Data Monitor: http://opendatamonitor.eu

Open Data Network: http://www.opendatanetwork.com

R Datasets: http://www.stats4stem.org/data-sets.html

R Datasets packages: R Dataset packages

Datasets: http://www.statsci.org/datasets.html

Portal de Estatística: http://www.statista.com

Data 360: http://www.data360.org

Reconhecimento de Faces: http://www.face-rec.org/databases

Stanford Large Network Dataset Collection: http://snap.stanford.edu/data

Datahub: http://datahub.io/dataset

Esta é apenas uma pequena lista de dados abertos. O volume de dados não pára de aumentar e atualmente é possível encontrar dados livres sobre praticamente tudo que se possa imaginar.

David Matos

Relacionado

2 thoughts on “O Poder do Open Data”

  1. Pingback: Top 10 Open Datasets Para Construir Portfólio de Projetos em Data Science – Ciência e Dados
  2. Luiz Ferreira da Silva disse:
    4 de novembro de 2022 às 12:06 PM

    Vou procurar fazer mais busca usando esse banco de dados nós meus projetos

    Responder

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Assinar blog por e-mail

Digite seu endereço de e-mail para assinar este blog e receber notificações de novas publicações por e-mail.

Buscar

Tags Mais Comuns nos Posts

Agentes de IA Analytics Análise de Negócios Apache Spark AWS Big Data Blockchain Business Intelligence Cache-Augmented Generation (CAG) ChatGPT Cientista de Dados Cientistas de Dados Ciência de Dados Cloud Computing Data Lake Data Mesh Data Science Data Scientist Data Warehouse Deep Learning Deploy Engenharia de Dados Estatística GPU GraphRAG Hadoop IA Generativa Inteligência Artificial Internet of Things Linguagem Python Linguagem R LLM LLMs Machine Learning Metadados Normalização NVIDIA Oracle Pipeline de Dados Predictive Analytics Probabilidade PySpark Python RAG Storytelling

Histórico de Posts

  • maio 2025 (1)
  • abril 2025 (2)
  • março 2025 (4)
  • fevereiro 2025 (8)
  • janeiro 2025 (5)
  • dezembro 2024 (4)
  • novembro 2024 (1)
  • outubro 2024 (1)
  • setembro 2024 (1)
  • agosto 2024 (1)
  • julho 2024 (3)
  • junho 2024 (1)
  • maio 2024 (1)
  • abril 2024 (2)
  • março 2024 (1)
  • fevereiro 2024 (1)
  • janeiro 2024 (1)
  • dezembro 2023 (1)
  • outubro 2023 (2)
  • setembro 2023 (1)
  • agosto 2023 (4)
  • julho 2023 (2)
  • junho 2023 (4)
  • maio 2023 (2)
  • abril 2023 (2)
  • março 2023 (3)
  • fevereiro 2023 (3)
  • janeiro 2023 (3)
  • dezembro 2022 (7)
  • novembro 2022 (6)
  • outubro 2022 (2)
  • setembro 2022 (3)
  • agosto 2022 (2)
  • julho 2022 (2)
  • junho 2022 (3)
  • maio 2022 (1)
  • abril 2022 (3)
  • março 2022 (1)
  • fevereiro 2022 (3)
  • janeiro 2022 (2)
  • dezembro 2021 (1)
  • novembro 2021 (5)
  • outubro 2021 (2)
  • setembro 2021 (3)
  • agosto 2021 (1)
  • junho 2021 (1)
  • fevereiro 2021 (2)
  • janeiro 2021 (1)
  • dezembro 2020 (1)
  • novembro 2020 (1)
  • outubro 2020 (2)
  • agosto 2020 (1)
  • abril 2020 (1)
  • março 2020 (1)
  • fevereiro 2020 (2)
  • agosto 2019 (1)
  • abril 2019 (1)
  • setembro 2018 (2)
  • julho 2018 (1)
  • junho 2018 (3)
  • abril 2018 (1)
  • março 2018 (1)
  • fevereiro 2018 (2)
  • janeiro 2018 (1)
  • dezembro 2017 (1)
  • novembro 2017 (1)
  • outubro 2017 (1)
  • setembro 2017 (1)
  • julho 2017 (1)
  • junho 2017 (1)
  • maio 2017 (2)
  • abril 2017 (1)
  • janeiro 2017 (1)
  • novembro 2016 (1)
  • outubro 2016 (1)
  • setembro 2016 (1)
  • julho 2016 (1)
  • junho 2016 (1)
  • maio 2016 (1)
  • abril 2016 (1)
  • fevereiro 2016 (1)
  • janeiro 2016 (3)
  • dezembro 2015 (4)
  • novembro 2015 (6)
  • outubro 2015 (9)
  • setembro 2015 (9)
  • agosto 2015 (9)
©2025 Ciência e Dados