revert unintended change

meenchen · meenchen · commit cd036ed7e6e1 · 2025-10-14T18:45:48.000Z
Signed-off-by: weimingc &lt;17592131+meenchen@users.noreply.github.com&gt;
diff --git a/examples/vllm_serve/vllm_serve_fakequant.py b/examples/vllm_serve/vllm_serve_fakequant.py
@@ -97,8 +97,7 @@ def disable_compilation(model):
 quant_config: dict[str, Any] = {
     "quant_dataset": "cnn_dailymail",
     "quant_num_samples": 512,
-    # "quant_format": "NVFP4_DEFAULT_CFG",
-    "quant_format": "NVFP4_AWQ_LITE_CFG",
+    "quant_format": "NVFP4_DEFAULT_CFG",
     "amax_file_path": None,  # Optional: path to pre-computed amax values (e.g., "/path/to/amax.pt")
 }
 
@@ -177,7 +176,6 @@ def calibrate_loop(model: Any = None) -> None:
 
     quant_cfg = getattr(mtq, quant_config["quant_format"])
 
-    print(f"Quantizing model with {quant_config['quant_format']} format")
     with disable_compilation(self.model):
         mtq.quantize(self.model, quant_cfg, forward_loop=calibrate_loop)