ggml-impl.h: Fix build issues on AArch64 with CUDA version 12

zhengjun-xing · zhengjun-xing · commit d85170bb624d · 2025-04-10T10:29:30.000Z
Fix ggml-org#12732: * Remove incorrect inclusion of "arm_neon.h" for CUDA versions ≥ 12
diff --git a/ggml/src/ggml-impl.h b/ggml/src/ggml-impl.h
@@ -301,6 +301,14 @@ struct ggml_cgraph ggml_graph_view(struct ggml_cgraph * cgraph, int i0, int i1);
 GGML_API void * ggml_aligned_malloc(size_t size);
 GGML_API void ggml_aligned_free(void * ptr, size_t size);
 
+#if defined(__ARM_NEON) && !defined(__CUDACC__) && !defined(__MUSACC__)
+// if YCM cannot find <arm_neon.h>, make a symbolic link to it, for example:
+//
+// $ ln -sfn /Library/Developer/CommandLineTools/usr/lib/clang/13.1.6/include/arm_neon.h ./src/
+//
+#include <arm_neon.h>
+#endif
+
 // FP16 to FP32 conversion
 
 // 16-bit float
@@ -312,12 +320,6 @@ GGML_API void ggml_aligned_free(void * ptr, size_t size);
 //
 #if defined(__ARM_NEON) && !(defined(__CUDACC__) && __CUDACC_VER_MAJOR__ <= 11) && !defined(__MUSACC__)
 
-    // if YCM cannot find <arm_neon.h>, make a symbolic link to it, for example:
-    //
-    //   $ ln -sfn /Library/Developer/CommandLineTools/usr/lib/clang/13.1.6/include/arm_neon.h ./src/
-    //
-    #include <arm_neon.h>
-
     #define GGML_COMPUTE_FP16_TO_FP32(x) ggml_compute_fp16_to_fp32(x)
     #define GGML_COMPUTE_FP32_TO_FP16(x) ggml_compute_fp32_to_fp16(x)