Skip to content

GuillaumeLarue/MLOPS

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MLOPS

Sujet numéro 8 : génération et récolte de données avec Kafka

Détails du projet

Dans une raffinerie, il y a des milliers de capteurs qui envoient des données toutes les minutes. Ainsi s'il y a une erreur, elle est très vite détecté. Cependant, il doit aussi toujours il doit y avoir un suivi des logs de tous les capteurs pour en suivre leurs dysfonctionnements.

C'est pourquoi nous allons utiliser une architecture lambda dans ce projet.

Une partie des données considérés comme critique doivent être envoyé au plus vite aux techniciens. Et un autre partie doit stocker tous les logs.

Et pour finir il y aura une partie qui va permettre de faire des statistiques sur les données.

Les messages seront générés aléatoirement.

Technologies utilisées (TODO)

  • Kafka
  • Spark (PySpark)
  • Cassandra
  • Airflow (Le bonus)

Airflow

Airflow

Airflow

Airflow

Schéma de l'architecture

Architecture

Authors :

  • Guillaume Larue
  • Nicolas Trabet

About

Data generation and collection with Kafka

Topics

Resources

Stars

Watchers

Forks

Languages