Add prepare_dlc_dev_environment script to assist in preparation of de…

…v toml (#3974)
aws · Jun 14, 2024 · 4ace9e0 · 4ace9e0
1 parent f9cbefc
commit 4ace9e0
Show file tree

Hide file tree

Showing 2 changed files with 288 additions and 0 deletions.
diff --git a/src/prepare_dlc_dev_environment.py b/src/prepare_dlc_dev_environment.py
@@ -0,0 +1,200 @@
+import argparse
+import logging
+import sys
+import toml
+import re
+
+from config import get_dlc_developer_config_path
+
+
+LOGGER = logging.getLogger(__name__)
+LOGGER.setLevel(logging.DEBUG)
+LOGGER.addHandler(logging.StreamHandler(sys.stdout))
+# LOGGER.addHandler(logging.StreamHandler(sys.stderr))
+
+
+VALID_TEST_TYPES = [
+    "sanity_tests",
+    "ec2_tests",
+    "ecs_tests",
+    "eks_tests",
+    "sagemaker_remote_tests",
+    "sagemaker_local_tests",
+]
+
+
+def get_args():
+    """
+    Manage arguments to this script when called directly
+    """
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "--partner_toml",
+        default=get_dlc_developer_config_path(),
+        help="TOML file with partner developer information",
+    )
+    parser.add_argument(
+        "--frameworks",
+        nargs="+",
+        choices=["pytorch", "tensorflow"],
+        required=True,
+        help="ML Framework for which to prepare developer enviornment",
+    )
+    parser.add_argument(
+        "--job_types",
+        nargs="+",
+        choices=["training", "inference"],
+        default=["training", "inference"],
+        help="Training and inference containers to prepare developer environment",
+    )
+    parser.add_argument(
+        "--tests",
+        nargs="+",
+        choices=VALID_TEST_TYPES,
+        default=VALID_TEST_TYPES,
+        help="Types of tests to run",
+    )
+    parser.add_argument(
+        "--dev_mode",
+        choices=["graviton_mode", "neuronx_mode", "deep_canary_mode"],
+        default=None,
+        help="Enable developer mode for specific hardware targets",
+    )
+    parser.add_argument(
+        "--buildspec",
+        help="Path to a buildspec file from the deep-learning-containers folder",
+    )
+
+    return parser.parse_args()
+
+
+class TomlOverrider:
+    def __init__(self):
+        self._overrides = {
+            "build": {},
+            "test": {},
+            "dev": {},
+            "buildspec_override": {},
+        }
+
+    def set_build_frameworks(self, frameworks):
+        """
+        This method takes a list of frameworks as input and assembles a dictionary with the key
+        'build_frameworks' and the value as a list of unique framework names. The resulting
+        dictionary is stored in the _overrides attribute of the TomlOverrider object
+        """
+        unique_frameworks = list(set(frameworks))
+        self._overrides["build"]["build_frameworks"] = sorted(unique_frameworks)
+
+    def set_job_type(self, job_types):
+        """
+        Job type can be one of (or both) "training" or "inference"
+
+        If job_type is training, set build_training to True, and build_inference to False
+        If job type is inference, set build_training to False, and build_inference to True
+        If both are set, set both to true
+        """
+        build_training = "training" in job_types
+        build_inference = "inference" in job_types
+        self._overrides["build"]["build_training"] = build_training
+        self._overrides["build"]["build_inference"] = build_inference
+
+    def set_test_types(self, test_types):
+        """
+        This method takes a list of test types as input and updates the test overrides dictionary
+        based on the provided test types. It assumes that all tests are enabled by default, except
+        for ec2_benchmark_tests. The provided test types will be kept enabled.
+        """
+        self._overrides["test"] = {test_type: False for test_type in VALID_TEST_TYPES}
+        for test_type in test_types:
+            self._overrides["test"][test_type] = True
+
+    def set_dev_mode(self, dev_mode):
+        """
+        Set the dev mode based on the user input.
+        Valid choices are 'graviton_mode', 'neuronx_mode', and 'deep_canary_mode'.
+        """
+        # Reset all dev modes to False
+        self._overrides["dev"]["graviton_mode"] = False
+        self._overrides["dev"]["neuronx_mode"] = False
+        self._overrides["dev"]["deep_canary_mode"] = False
+
+        if dev_mode:
+            self._overrides["dev"][dev_mode] = True
+
+    def set_buildspec(self, buildspec_path):
+        """
+        WARNING: This method is not fully implemented
+
+        This method takes a buildspec path as input and updates the corresponding key in the
+        buildspec_override section of the TOML file.
+        """
+        # define the expected file path syntax:
+        # <framework>/<framework>/<job_type>/buildspec-<version>-<version>.yml
+        buildspec_pattern = r"^(\S+)/(training|inference)/buildspec(\S*)\.yml$"
+
+        if not buildspec_path:
+            return
+
+        # validate the buildspec_path format
+        match = re.match(buildspec_pattern, buildspec_path)
+        if not match:
+            raise ValueError(f"Invalid buildspec_path format: {buildspec_path}")
+
+        # extract the framework, job_type, and version from the buildspec_path
+        framework = match.group(1)
+        job_type = match.group(3)
+        # construct the build_job name using the extracted information
+        build_job = f"dlc-pr-{framework}-{job_type}"
+
+        self._overrides["buildspec_override"][build_job] = buildspec_path
+
+    @property
+    def overrides(self):
+        return self._overrides
+
+
+def write_toml(toml_path, overrides):
+    with open(toml_path, "r") as toml_file_reader:
+        loaded_toml = toml.load(toml_file_reader)
+
+    for key, value in overrides.items():
+        if key == "buildspec_override":
+            for k, v in value.items():
+                loaded_toml["buildspec_override"][k] = v
+        else:
+            for k, v in value.items():
+                loaded_toml[key][k] = v
+
+    with open(toml_path, "w") as toml_file_writer:
+        output = toml.dumps(loaded_toml).split("\n")
+        for line in output:
+            toml_file_writer.write(f"{line}\n")
+
+
+def main():
+    args = get_args()
+    frameworks = args.frameworks
+    job_types = args.job_types
+    toml_path = args.partner_toml
+    test_types = args.tests
+    dev_mode = args.dev_mode
+    buildspec_path = args.buildspec
+
+    LOGGER.info(f"Inferring framework to be {frameworks}...")
+
+    overrider = TomlOverrider()
+
+    # handle frameworks to build
+    overrider.set_build_frameworks(frameworks=frameworks)
+    overrider.set_job_type(job_types=job_types)
+    overrider.set_test_types(test_types=test_types)
+    overrider.set_dev_mode(dev_mode=dev_mode)
+    overrider.set_buildspec(buildspec_path=buildspec_path)
+
+    LOGGER.info(overrider.overrides)
+    write_toml(toml_path, overrides=overrider.overrides)
+
+
+if __name__ == "__main__":
+    main()
diff --git a/test/dlc_tests/sanity/quick_checks/test_prepare_dev_env.py b/test/dlc_tests/sanity/quick_checks/test_prepare_dev_env.py
@@ -0,0 +1,88 @@
+import pytest
+
+from src import prepare_dlc_dev_environment
+
+
+@pytest.mark.quick_checks
+@pytest.mark.model("N/A")
+@pytest.mark.integration("build_frameworks")
+def test_build_frameworks():
+    overrider = prepare_dlc_dev_environment.TomlOverrider()
+    overrider.set_build_frameworks(("pytorch", "tensorflow"))
+
+    assert overrider.overrides["build"]["build_frameworks"] == ["pytorch", "tensorflow"]
+
+
+@pytest.mark.quick_checks
+@pytest.mark.model("N/A")
+@pytest.mark.integration("job_types")
+def test_build_job_types():
+    overrider = prepare_dlc_dev_environment.TomlOverrider()
+    overrider.set_job_type(("inference", "training"))
+    assert (
+        overrider.overrides["build"]["build_training"] == True
+        and overrider.overrides["build"]["build_inference"] == True
+    )
+
+    overrider.set_job_type(["inference"])
+    assert (
+        overrider.overrides["build"]["build_training"] == False
+        and overrider.overrides["build"]["build_inference"] == True
+    )
+
+    overrider.set_job_type(["training"])
+    assert (
+        overrider.overrides["build"]["build_training"] == True
+        and overrider.overrides["build"]["build_inference"] == False
+    )
+
+    overrider.set_job_type([])
+    assert (
+        overrider.overrides["build"]["build_training"] == False
+        and overrider.overrides["build"]["build_inference"] == False
+    )
+
+
+@pytest.mark.quick_checks
+@pytest.mark.model("N/A")
+@pytest.mark.integration("test_types")
+def test_set_test_types():
+    overrider = prepare_dlc_dev_environment.TomlOverrider()
+
+    # Test case with a subset of test types
+    test_types = ["ec2_tests", "ecs_tests", "sagemaker_remote_tests"]
+    overrider.set_test_types(test_types)
+    assert overrider.overrides["test"]["sanity_tests"] == False
+    assert overrider.overrides["test"]["ecs_tests"] == True
+    assert overrider.overrides["test"]["eks_tests"] == False
+    assert overrider.overrides["test"]["ec2_tests"] == True
+    assert overrider.overrides["test"]["sagemaker_local_tests"] == False
+    assert overrider.overrides["test"]["sagemaker_remote_tests"] == True
+
+
+@pytest.mark.quick_checks
+@pytest.mark.model("N/A")
+@pytest.mark.integration("dev_mode")
+def test_set_dev_mode():
+    overrider = prepare_dlc_dev_environment.TomlOverrider()
+
+    # test with no dev mode provided
+    overrider.set_dev_mode(None)
+    assert overrider.overrides["dev"]["graviton_mode"] == False
+    assert overrider.overrides["dev"]["neuronx_mode"] == False
+    assert overrider.overrides["dev"]["deep_canary_mode"] == False
+
+    overrider.set_dev_mode("graviton_mode")
+    assert overrider.overrides["dev"]["graviton_mode"] == True
+    assert overrider.overrides["dev"]["neuronx_mode"] == False
+    assert overrider.overrides["dev"]["deep_canary_mode"] == False
+
+    overrider.set_dev_mode("neuronx_mode")
+    assert overrider.overrides["dev"]["graviton_mode"] == False
+    assert overrider.overrides["dev"]["neuronx_mode"] == True
+    assert overrider.overrides["dev"]["deep_canary_mode"] == False
+
+    overrider.set_dev_mode("deep_canary_mode")
+    assert overrider.overrides["dev"]["graviton_mode"] == False
+    assert overrider.overrides["dev"]["neuronx_mode"] == False
+    assert overrider.overrides["dev"]["deep_canary_mode"] == True