Ter um bom portfólio de projetos para buscar vagas em Data Science é um diferencial. E isso já não é novidade! Mas encontrar bons datasets públicos pode ser um desafio.
Para ajudar você, abaixo está a lista de 7 Datasets Públicos Para Projetos de Data Science:
1- Australian Fatal Road Accident 1989-2021
Este é um conjunto de dados relativamente novo cujo objetivo é classificar o tipo de acidente a partir dos vários recursos disponíveis sobre o acidente, como hora e dia do acidente, velocidade do veículo, etc.
Com esse dataset você pode determinar se um candidato (aluno de uma instituição de ensino) será contratado por uma empresa com base em vários recursos, como educação, notas e assim por diante.
Dataset que pode ser usado para prever a presença de doença cardíaca no paciente com base em um conjunto de 76 atributos fisiológicos diferentes de cada indivíduo.
4- CelebFaces Attributes (CelebA) Dataset
Um popular dataset com mais de 200 mil imagens de celebridades, que pode ser usado para praticar conceitos de visão computacional a fim de implementar reconhecimento facial.
Um conjunto de dados de preços de ações para todos os fãs da Tesla e para aqueles que gostam de mergulhar nas complexidades do setor financeiro.
Excelente dataset para praticar suas habilidades de análise exploratória de dados.
7- Netflix Movies and TV Shows
Coleção de detalhes de filmes e programas de TV até 2019, também ótimo para alguma exposição prática a um aplicativo do mundo real.
David Matos
Outras Fontes de Dados:
Top 10 Open Datasets Para Construir Portfólio de Projetos em Data Science