finished model trainer withouth tracking MLFlow

pycoder49 · pycoder49 · commit a6504e87d0ff · 2025-11-03T22:59:34.000-08:00
diff --git a/main.py b/main.py
@@ -1,13 +1,15 @@
 from network_security.components.data_ingestion import DataIngestion
 from network_security.components.data_validation import DataValidation
 from network_security.components.data_transformation import DataTransformation
+from network_security.components.model_trainer import ModelTrainer
 from network_security.exceptions.exception import NetworkSecurityException
 from network_security.logging.logger import logging
 from network_security.entity.config_entity import (
     TrainingPipelineConfig,
     DataIngestionConfig, 
     DataValidationConfig,
     DataTransformationConfig,
+    ModelTrainerConfig
 )
 import sys
 
@@ -53,6 +55,18 @@
         data_transformation_artifact = data_transformation.initiate_data_transformation()
         print(f"Data Transformation Artifact: \n{data_transformation_artifact} \n")
 
+        # model trainer configuration
+        model_trainer_config = ModelTrainerConfig(training_pipeline_config=training_pipeline_config)
+        model_trainer = ModelTrainer(
+            data_transformation_artifact = data_transformation_artifact,
+            model_trainer_config = model_trainer_config
+        )
+
+        # initiating model trainer
+        logging.info("Initiating model trainer")
+        model_trainer_artifact = model_trainer.initiate_model_trainer()
+        print(f"Model Trainer Artifact: \n{model_trainer_artifact} \n")
+
 
     except Exception as e:
         raise NetworkSecurityException(e, sys)
diff --git a/network_security/components/model_trainer.py b/network_security/components/model_trainer.py
@@ -0,0 +1,183 @@
+from network_security.exceptions.exception import NetworkSecurityException
+from network_security.logging.logger import logging
+from network_security.utils.ml_utils.model.estimator import NetworkModel
+from network_security.utils.ml_utils.metric.classification_metric import get_classification_score
+import network_security.constants.training_pipeline as tp
+from network_security.entity.config_entity import (
+    DataTransformationConfig,
+    ModelTrainerConfig
+)
+from network_security.entity.artifact_entity import (
+    DataTransformationArtifact,
+    ModelTrainerArtifact
+)
+from network_security.utils.main_utils.utils import (
+    save_object, 
+    load_object, 
+    load_numpy_array,
+    evaluate_models
+)
+
+from sklearn.linear_model import LogisticRegression
+from sklearn.neighbors import KNeighborsClassifier
+from sklearn.tree import DecisionTreeClassifier
+from sklearn.ensemble import (
+    AdaBoostClassifier,
+    GradientBoostingClassifier,
+    RandomForestClassifier,
+)
+from xgboost import XGBClassifier
+from sklearn.metrics import r2_score
+
+import pandas as pd
+import numpy as np
+import os, sys
+
+
+class ModelTrainer:
+    def __init__(self, model_trainer_config: ModelTrainerConfig,
+                 data_transformation_artifact: DataTransformationArtifact):
+        try:
+            self.model_trainer_config = model_trainer_config
+            self.data_transformation_artifact = data_transformation_artifact
+        except Exception as e:
+            raise NetworkSecurityException(e, sys)
+        
+
+
+    def train_model(self, X_train, y_train, X_test, y_test) -> object:
+        try:
+            logging.info("Training the model")
+            
+            # intializing models
+            models = {
+                "LogisticRegression": LogisticRegression(max_iter=1000),
+                "KNeighborsClassifier": KNeighborsClassifier(),
+                "DecisionTreeClassifier": DecisionTreeClassifier(),
+                "RandomForestClassifier": RandomForestClassifier(),
+                "AdaBoostClassifier": AdaBoostClassifier(),
+                "GradientBoostingClassifier": GradientBoostingClassifier(),
+                "XGBClassifier": XGBClassifier()
+            }
+
+            # defining parameters for hyperparameter tuning
+            params = {
+                "DecisionTreeClassifier": {
+                    "criterion": ['gini', 'entropy'],
+                    # "splitter": ['best', 'random'],
+                    # "max_features": ['sqrt', 'log2', None],
+                    # "max_depth": [3, 5, 10, 15, 20, None]
+                },
+                "RandomForestClassifier": {
+                    # "criterion": ['gini', 'entropy', "log_loss"],
+                    # "max_features": ['sqrt', 'log2', None],
+                    "n_estimators": [50, 100, 200],
+                    "max_depth": [3, 5, 10, 15, 20, None]
+                },
+                "GradientBoostingClassifier": {
+                    "loss": ['log_loss', 'exponential'],
+                    # "learning_rate": [0.1, 0.01, 0.001, 0.05],
+                    # "subsample": [0.6, 0.7, 0.75, 0.8, 0.85, 0.9],
+                    # "criterion": ['friedman_mse', 'squared_error'],
+                    # "max_features": ['sqrt', 'log2', None],
+                    "n_estimators": [50, 100, 200],
+                    # "max_depth": [3, 5, 10]
+                },
+                "LogisticRegression": {
+                    # "penalty": ['l1', 'l2', 'elasticnet', None],
+                    # "C": [0.01, 0.1, 1.0, 10.0, 100.0],
+                    # "solver": ['newton-cg', 'lbfgs', 'liblinear', 'sag', 'saga'],
+                    "max_iter": [100, 200, 500]
+                },
+                "KNeighborsClassifier": {
+                    "n_neighbors": [3, 5, 7, 9, 11],
+                    # "weights": ['uniform', 'distance'],
+                    # "algorithm": ['auto', 'ball_tree', 'kd_tree', 'brute'],
+                    # "p": [1, 2],
+                    # "leaf_size": [10, 20, 30, 40, 50]
+                },
+                "AdaBoostClassifier": {
+                    "n_estimators": [50, 100, 200],
+                    "learning_rate": [0.1, 0.01, 0.001, 0.05, 1.0],
+                    # "algorithm": ['SAMME', 'SAMME.R']
+                },
+                "XGBClassifier": {
+                    "n_estimators": [50, 100, 200],
+                    # "learning_rate": [0.1, 0.01, 0.001, 0.05],
+                    # "max_depth": [3, 5, 7, 9],
+                    # "gamma": [0, 0.1, 0.2],
+                    # "subsample": [0.6, 0.7, 0.8, 0.9]
+                }
+            }
+
+            model_report: dict = evaluate_models(
+                X_train= X_train,
+                y_train= y_train,
+                X_test = X_test,
+                y_test = y_test,
+                models = models,
+                params = params
+            )
+
+            # getting the best model score from the report
+            best_model_name = max(model_report, key=model_report.get)
+            best_model_score = max(sorted(model_report.values()))
+            best_model = models[best_model_name]
+
+            y_train_pred = best_model.predict(X_train)
+            train_classification_metric = get_classification_score(y_true=y_train, y_pred=y_train_pred)
+
+            # tracking the MLFlow
+
+
+            # getting the test classification metrics
+            y_test_pred = best_model.predict(X_test)
+            test_classification_metric = get_classification_score(y_true=y_test, y_pred=y_test_pred)
+
+            # loading the object, saving it
+            preprocessor = load_object(file_path=self.data_transformation_artifact.transformation_object_path)
+            model_dir_path = os.path.dirname(self.model_trainer_config.trained_model_file_path)
+            os.makedirs(model_dir_path, exist_ok=True)
+            
+            # saving the object
+            network_model = NetworkModel(preprocessor=preprocessor, model=best_model)
+            save_object(
+                file_path=self.model_trainer_config.trained_model_file_path,
+                obj=network_model
+            )
+
+            # saving the model trainer artifact
+            model_trainer_artifact = ModelTrainerArtifact(
+                trained_model_file_path=self.model_trainer_config.trained_model_file_path,
+                train_metric_artifact=train_classification_metric,
+                test_metric_artifact=test_classification_metric
+            )
+            return model_trainer_artifact
+        except Exception as e:
+            raise NetworkSecurityException(e, sys)
+
+
+
+
+
+    def initiate_model_trainer(self) -> ModelTrainerArtifact:
+        try:
+            logging.info("Initiating model trainer")
+            train_file_path = self.data_transformation_artifact.transformed_train_file_path
+            test_file_path = self.data_transformation_artifact.transformed_test_file_path
+
+            # loading the training and testing arrays
+            training_array = load_numpy_array(file_path=train_file_path)
+            testing_array = load_numpy_array(file_path=test_file_path)
+
+            # splitting the training and testing arrays into input and target feature arrays
+            X_train, y_train = training_array[:, :-1], training_array[:, -1]
+            X_test, y_test = testing_array[:, :-1], testing_array[:, -1]
+
+            # creating model
+            model = self.train_model(X_train, y_train, X_test, y_test)
+
+            logging.info("Model training completed")
+            return model
+        except Exception as e:
+            raise NetworkSecurityException(e, sys)
diff --git a/network_security/constants/training_pipeline/__init__.py b/network_security/constants/training_pipeline/__init__.py
@@ -55,4 +55,13 @@
     "missing_values": np.nan,
     "n_neighbors": 3,
     "weights": "uniform",
-}
+}
+
+""""
+Defining constants for model trainer
+"""
+MODEL_TRAINER_DIR_NAME: str = "model_trainer"
+MODEL_TRAINER_TRAINED_MODEL_DIR: str = "trained_model"
+MODEL_TRAINER_TRAINED_MODEL_FILE_NAME: str = "model.pkl"
+MODEL_TRAINER_EXPECTED_ACCURACY: float = 0.7
+MODEL_TRAINER_OVERFITTING_UNDERFITTING_THRESHOLD: float = 0.1
diff --git a/network_security/entity/artifact_entity.py b/network_security/entity/artifact_entity.py
@@ -1,7 +1,5 @@
 from dataclasses import dataclass
 
-import os
-
 @dataclass
 class DataIngestionArtifact:
     train_file_path: str
@@ -20,4 +18,16 @@ class DataValidationArtifact:
 class DataTransformationArtifact:
     transformed_train_file_path: str
     transformed_test_file_path: str
-    transformation_object_path: str
+    transformation_object_path: str
+
+@dataclass
+class ClassificationMetricArtifact:
+    f1_score: float
+    precision_score: float
+    recall_score: float
+
+@dataclass
+class ModelTrainerArtifact:
+    trained_model_file_path: str
+    train_metric_artifact: ClassificationMetricArtifact
+    test_metric_artifact: ClassificationMetricArtifact
diff --git a/network_security/entity/config_entity.py b/network_security/entity/config_entity.py
@@ -96,4 +96,18 @@ def __init__(self, training_pipeline_config:TrainingPipelineConfig):
             self.data_transformation_dir,
             training_pipeline.DATA_TRANSFORMATION_TRANSFORMED_OBJECT_DIR,
             training_pipeline.DATA_TRANSFORMATION_TRANSFORMED_OBJECT_FILE_NAME,
-        )
+        )
+
+
+class ModelTrainerConfig:
+    def __init__(self, training_pipeline_config: TrainingPipelineConfig):
+        self.model_trainer_dir: str = os.path.join(
+            training_pipeline_config.artifact_dir, training_pipeline.MODEL_TRAINER_DIR_NAME
+        )
+        self.trained_model_file_path: str = os.path.join(
+            self.model_trainer_dir, 
+            training_pipeline.MODEL_TRAINER_TRAINED_MODEL_DIR,
+            training_pipeline.MODEL_TRAINER_TRAINED_MODEL_FILE_NAME
+        )
+        self.expected_accuracy: float = training_pipeline.MODEL_TRAINER_EXPECTED_ACCURACY
+        self.overfitting_underfitting_threshold: float = training_pipeline.MODEL_TRAINER_OVERFITTING_UNDERFITTING_THRESHOLD
diff --git a/network_security/utils/main_utils/utils.py b/network_security/utils/main_utils/utils.py
@@ -1,5 +1,9 @@
 from network_security.exceptions.exception import NetworkSecurityException
 from network_security.logging.logger import logging
+
+from sklearn.model_selection import GridSearchCV
+from sklearn.metrics import r2_score
+
 import pandas as pd
 import numpy as np
 import os, sys
@@ -39,6 +43,16 @@ def save_numpy_array(file_path: str, array: np.array) -> None:
             np.save(file, array)
     except Exception as e:
         raise NetworkSecurityException(e, sys)
+    
+
+def load_numpy_array(file_path: str) -> np.array:
+    try:
+        if not os.path.exists(file_path):
+            raise Exception(f"The file: {file_path} does not exist")
+        with open(file_path, "rb") as file:
+            return np.load(file)
+    except Exception as e:
+        raise NetworkSecurityException(e, sys)
 
 
 def save_object(file_path: str, obj: object) -> None:
@@ -48,3 +62,51 @@ def save_object(file_path: str, obj: object) -> None:
             pickle.dump(obj, file)
     except Exception as e:
         raise NetworkSecurityException(e, sys)
+    
+
+def load_object(file_path: str) -> object:
+    try:
+        if not os.path.exists(file_path):
+            raise Exception(f"The file: {file_path} does not exist")
+        with open(file_path, "rb") as file:
+            return pickle.load(file)
+    except Exception as e:
+        raise NetworkSecurityException(e, sys)
+
+
+def evaluate_models(X_train, y_train, 
+                    X_test, y_test,
+                    models: dict, 
+                    params: dict
+                    ) -> dict:
+    try:
+        report = {}
+        
+        for model_name, model in models.items():
+            # Get parameters for this model
+            param = params[model_name]
+
+            # Perform GridSearch
+            gs = GridSearchCV(model, param, cv=3)
+            gs.fit(X_train, y_train)
+
+            # Set best parameters and retrain
+            model.set_params(**gs.best_params_)
+            model.fit(X_train, y_train)
+
+            # Make predictions
+            y_train_pred = model.predict(X_train)
+            y_test_pred = model.predict(X_test)
+
+            # Calculate scores
+            train_model_score = r2_score(y_train, y_train_pred)
+            test_model_score = r2_score(y_test, y_test_pred)
+
+            # Store test score in report
+            report[model_name] = test_model_score
+            
+        return report
+        
+    except Exception as e:
+        raise NetworkSecurityException(e, sys)
+    
diff --git a/network_security/utils/ml_utils/metric/classification_metric.py b/network_security/utils/ml_utils/metric/classification_metric.py
@@ -0,0 +1,21 @@
+from network_security.entity.artifact_entity import ClassificationMetricArtifact
+from network_security.exceptions.exception import NetworkSecurityException
+from sklearn.metrics import f1_score, precision_score, recall_score
+import numpy as np
+import sys
+
+
+def get_classification_score(y_true: np.array, y_pred: np.array) -> ClassificationMetricArtifact:
+    try:
+        model_f1_score = f1_score(y_true, y_pred)
+        model_precision_score = precision_score(y_true, y_pred)
+        model_recall_score = recall_score(y_true, y_pred)
+
+        classification_metric = ClassificationMetricArtifact(
+            f1_score=model_f1_score,
+            precision_score=model_precision_score,
+            recall_score=model_recall_score
+        )
+        return classification_metric
+    except Exception as e:
+        raise NetworkSecurityException(e, sys)
diff --git a/network_security/utils/ml_utils/model/estimator.py b/network_security/utils/ml_utils/model/estimator.py