Este projeto de catálogo de filmes foi desenvolvido a partir de dados coletados na empresa onde trabalho. Realizei uma limpeza nos dados, removendo todas as informações sensíveis. Para possibilitar a análise, incluí um campo de audiência fictício, uma vez que o índice de performance é um dado extremamente delicado. Os demais dados são verídicos e obtidos diretamente da empresa.
Escolhi trabalhar com filmes porque é um assunto pelo qual sou apaixonada e tenho um grande interesse.
Este projeto realiza uma análise de dados de um catálogo de filmes, com foco na audiência, gêneros, e anos de estreia. O objetivo é explorar as tendências nos dados e realizar testes estatísticos para entender melhor o comportamento do público.
Os resultados das análises e dos testes estatísticos são discutidos ao longo do código e podem ser visualizados nos gráficos gerados. O objetivo é fornecer insights sobre a audiência de filmes em diferentes gêneros e suas características.
catalogo_filmes.csv: Arquivo original contendo dados sobre filmes.catalogo_tratado.csv: Arquivo tratado com colunas renomeadas e dados formatados.analise_dados_filmes.py: Script Python que contém todo o código para a análise.
Para executar este projeto, você precisará das seguintes bibliotecas Python:
- pandas
- seaborn
- matplotlib
- scipy
Para instalar as bibliotecas necessárias, execute:
pip install pandas seaborn matplotlib scipy