Skip to content

Releases: Bulletdev/java-spark-data-analyzer

1.4

22 Apr 18:12

Choose a tag to compare

  • Refatoração da Estrutura:

    • Dividiu a classe monolítica DataAnalyzer em três classes com responsabilidades distintas:
      • DataAnalyzer: Orquestração principal e inicialização/encerramento do Spark.
      • SparkOperations: Encapsula todas as operações de manipulação de DataFrame do Spark.
      • UserInterface: Gerencia a interação com o usuário (menu e entrada de dados).
    • Isso melhora a organização, manutenibilidade e testabilidade do código.
  • Melhoria no Carregamento de Dados (loadData):

    • Adicionada a opção para listar arquivos .csv em um diretório especificado pelo usuário, facilitando a seleção sem digitar o caminho completo.
  • Nova Funcionalidade de Transformação:

    • Implementada a opção "Converter tipo de coluna" no menu de transformações.
    • Permite ao usuário alterar explicitamente o tipo de dado de uma coluna (String, Integer, Double, Boolean, Date, Timestamp) usando cast().

Essas mudanças tornam a ferramenta mais organizada, fácil de usar e poderosa para análise de dados.

1.3

09 Apr 14:48
52cc6ee

Choose a tag to compare

1.3

Todas as funcionalidades principais agora mostram barras de progresso:

  • Carregamento de arquivos CSV
  • Filtros de dados
  • Agregações
  • Estatísticas descritivas
  • Salvamento de resultados

1.1

09 Apr 14:34
fc95f3f

Choose a tag to compare

1.1
  • Nova classe ProgressBar.java - Uma classe reutilizável que implementa uma barra de progresso personalizável para o console.
    Atualização dos métodos principais:

  • loadData() - Agora mostra o progresso durante o carregamento de arquivos CSV

  • filterData() - Exibe o progresso ao aplicar filtros nos dados

  • aggregateData() - Mostra o progresso durante operações de agregação

1.0

09 Apr 13:57

Choose a tag to compare

1.0
  • Interface interativa de linha de comando
  • Carregamento e parsing de CSVs
  • Visualização de schemas e estatísticas descritivas
  • Filtros e agregações avançadas
  • Múltiplas transformações de dados
  • Exportação em diversos formatos (CSV, Parquet, JSON)