NVIDIA · cjluo-nv · Oct 6, 2025
@@ -15,5 +15,18 @@
 
 """Quantization backends."""
 
-from .gemm_registry import *
-from .nvfp4_gemm import *
+from .fp8_per_tensor_gemm import Fp8PerTensorLinear, _fp8_availability_check
+from .gemm_registry import gemm_registry
+from .nvfp4_gemm import Nvfp4Linear, _nvfp4_availability_check
+
+# Register default implementations
+gemm_registry.register(
+    gemm_func=Fp8PerTensorLinear.apply,
+    availability_check=_fp8_availability_check,
+)
+
+# Register default implementations
+gemm_registry.register(
+    gemm_func=Nvfp4Linear.apply,
+    availability_check=_nvfp4_availability_check,
+)