[Installation]: Can't find OpenMP headers on macOS #14034

realShengYao · 2025-02-28T10:20:31Z

Seems that clang can't find the OpenMP headers.

Your current environment

(vllm) ➜  vllm git:(v0.7.2) python collect_env.py 
INFO 02-28 18:13:24 __init__.py:190] Automatically detected platform cpu.
Collecting environment information...
PyTorch version: 2.5.1
Is debug build: False
CUDA used to build PyTorch: None
ROCM used to build PyTorch: N/A

OS: macOS 15.3.1 (arm64)
GCC version: Could not collect
Clang version: 16.0.0 (clang-1600.0.26.6)
CMake version: version 3.31.5
Libc version: N/A

Python version: 3.12.9 | packaged by Anaconda, Inc. | (main, Feb  6 2025, 12:55:12) [Clang 14.0.6 ] (64-bit runtime)
Python platform: macOS-15.3.1-arm64-arm-64bit
Is CUDA available: False
CUDA runtime version: No CUDA
CUDA_MODULE_LOADING set to: N/A
GPU models and configuration: No CUDA
Nvidia driver version: No CUDA
cuDNN version: No CUDA
HIP runtime version: N/A
MIOpen runtime version: N/A
Is XNNPACK available: True

CPU:
Apple M1 Max

Versions of relevant libraries:
[pip3] numpy==1.26.4
[pip3] pyzmq==26.2.1
[pip3] torch==2.5.1
[pip3] torchaudio==2.5.1
[pip3] torchvision==0.20.1
[pip3] transformers==4.49.0
[conda] numpy                     1.26.4          py312h7f4fdc5_0  
[conda] numpy-base                1.26.4          py312he047099_0  
[conda] pyzmq                     26.2.1                   pypi_0    pypi
[conda] torch                     2.5.1                    pypi_0    pypi
[conda] torchaudio                2.5.1                    pypi_0    pypi
[conda] torchvision               0.20.1                   pypi_0    pypi
[conda] transformers              4.49.0                   pypi_0    pypi
ROCM Version: Could not collect
Neuron SDK Version: N/A
vLLM Version: 0.7.2
vLLM Build Flags:
CUDA Archs: Not Set; ROCm: Disabled; Neuron: Disabled
GPU Topology:
Could not collect

LD_LIBRARY_PATH=/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages/cv2/../../lib:
NCCL_CUMEM_ENABLE=0
TORCHINDUCTOR_COMPILE_THREADS=1

How you are installing vllm

(vllm) ➜  vllm git:(v0.7.2) pip install -e .            
Obtaining file:///Users/shengyao/vllm
  Installing build dependencies ... done
  Checking if build backend supports build_editable ... done
  Getting requirements to build editable ... done
  Preparing editable metadata (pyproject.toml) ... done
Requirement already satisfied: psutil in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (7.0.0)
Requirement already satisfied: sentencepiece in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.2.0)
Requirement already satisfied: numpy<2.0.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.26.4)
Requirement already satisfied: requests>=2.26.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (2.32.3)
Requirement already satisfied: tqdm in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (4.67.1)
Requirement already satisfied: blake3 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.0.4)
Requirement already satisfied: py-cpuinfo in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (9.0.0)
Requirement already satisfied: transformers>=4.48.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (4.49.0)
Requirement already satisfied: tokenizers>=0.19.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.21.0)
Requirement already satisfied: protobuf in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (5.29.3)
Requirement already satisfied: fastapi!=0.113.*,!=0.114.0,>=0.107.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.115.9)
Requirement already satisfied: aiohttp in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (3.11.13)
Requirement already satisfied: openai>=1.52.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.65.1)
Requirement already satisfied: uvicorn[standard] in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.34.0)
Requirement already satisfied: pydantic>=2.9 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (2.10.6)
Requirement already satisfied: prometheus_client>=0.18.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.21.1)
Requirement already satisfied: pillow in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (11.1.0)
Requirement already satisfied: prometheus-fastapi-instrumentator>=7.0.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (7.0.2)
Requirement already satisfied: tiktoken>=0.6.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.9.0)
Requirement already satisfied: lm-format-enforcer<0.11,>=0.10.9 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.10.11)
Requirement already satisfied: outlines==0.1.11 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.1.11)
Requirement already satisfied: lark==1.2.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.2.2)
Requirement already satisfied: typing_extensions>=4.10 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (4.12.2)
Requirement already satisfied: filelock>=3.16.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (3.17.0)
Requirement already satisfied: partial-json-parser in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.2.1.1.post5)
Requirement already satisfied: pyzmq in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (26.2.1)
Requirement already satisfied: msgspec in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.19.0)
Requirement already satisfied: gguf==0.10.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.10.0)
Requirement already satisfied: importlib_metadata in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (8.6.1)
Requirement already satisfied: mistral_common>=1.5.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from mistral_common[opencv]>=1.5.0->vllm==0.7.2+cpu) (1.5.3)
Requirement already satisfied: pyyaml in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (6.0.2)
Requirement already satisfied: six>=1.16.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.17.0)
Requirement already satisfied: setuptools>=74.1.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (75.8.0)
Requirement already satisfied: einops in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.8.1)
Requirement already satisfied: compressed-tensors==0.9.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.9.1)
Requirement already satisfied: depyf==0.18.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.18.0)
Requirement already satisfied: cloudpickle in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (3.1.1)
Requirement already satisfied: torch==2.5.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (2.5.1)
Requirement already satisfied: torchaudio in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (2.5.1)
Requirement already satisfied: torchvision in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.20.1)
Requirement already satisfied: datasets in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (3.3.2)
Requirement already satisfied: astor in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from depyf==0.18.0->vllm==0.7.2+cpu) (0.8.1)
Requirement already satisfied: dill in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from depyf==0.18.0->vllm==0.7.2+cpu) (0.3.8)
Requirement already satisfied: interegular in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (0.3.3)
Requirement already satisfied: jinja2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (3.1.5)
Requirement already satisfied: nest_asyncio in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (1.6.0)
Requirement already satisfied: diskcache in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (5.6.3)
Requirement already satisfied: referencing in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (0.36.2)
Requirement already satisfied: jsonschema in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (4.23.0)
Requirement already satisfied: pycountry in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (24.6.1)
Requirement already satisfied: airportsdata in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (20250224)
Requirement already satisfied: outlines_core==0.1.26 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (0.1.26)
Requirement already satisfied: networkx in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from torch==2.5.1->vllm==0.7.2+cpu) (3.4.2)
Requirement already satisfied: fsspec in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from torch==2.5.1->vllm==0.7.2+cpu) (2024.12.0)
Requirement already satisfied: sympy==1.13.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from torch==2.5.1->vllm==0.7.2+cpu) (1.13.1)
Requirement already satisfied: mpmath<1.4,>=1.1.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from sympy==1.13.1->torch==2.5.1->vllm==0.7.2+cpu) (1.3.0)
Requirement already satisfied: starlette<0.46.0,>=0.40.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from fastapi!=0.113.*,!=0.114.0,>=0.107.0->vllm==0.7.2+cpu) (0.45.3)
Requirement already satisfied: packaging in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from lm-format-enforcer<0.11,>=0.10.9->vllm==0.7.2+cpu) (24.2)
Requirement already satisfied: opencv-python-headless>=4.0.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from mistral_common[opencv]>=1.5.0->vllm==0.7.2+cpu) (4.11.0.86)
Requirement already satisfied: anyio<5,>=3.5.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (4.8.0)
Requirement already satisfied: distro<2,>=1.7.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (1.9.0)
Requirement already satisfied: httpx<1,>=0.23.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (0.28.1)
Requirement already satisfied: jiter<1,>=0.4.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (0.8.2)
Requirement already satisfied: sniffio in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (1.3.1)
Requirement already satisfied: annotated-types>=0.6.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pydantic>=2.9->vllm==0.7.2+cpu) (0.7.0)
Requirement already satisfied: pydantic-core==2.27.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pydantic>=2.9->vllm==0.7.2+cpu) (2.27.2)
Requirement already satisfied: charset-normalizer<4,>=2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from requests>=2.26.0->vllm==0.7.2+cpu) (3.4.1)
Requirement already satisfied: idna<4,>=2.5 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from requests>=2.26.0->vllm==0.7.2+cpu) (3.10)
Requirement already satisfied: urllib3<3,>=1.21.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from requests>=2.26.0->vllm==0.7.2+cpu) (2.3.0)
Requirement already satisfied: certifi>=2017.4.17 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from requests>=2.26.0->vllm==0.7.2+cpu) (2025.1.31)
Requirement already satisfied: regex>=2022.1.18 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from tiktoken>=0.6.0->vllm==0.7.2+cpu) (2024.11.6)
Requirement already satisfied: huggingface-hub<1.0,>=0.16.4 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from tokenizers>=0.19.1->vllm==0.7.2+cpu) (0.29.1)
Requirement already satisfied: safetensors>=0.4.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from transformers>=4.48.2->vllm==0.7.2+cpu) (0.5.3)
Requirement already satisfied: aiohappyeyeballs>=2.3.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (2.4.6)
Requirement already satisfied: aiosignal>=1.1.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (1.3.2)
Requirement already satisfied: attrs>=17.3.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (25.1.0)
Requirement already satisfied: frozenlist>=1.1.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (1.5.0)
Requirement already satisfied: multidict<7.0,>=4.5 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (6.1.0)
Requirement already satisfied: propcache>=0.2.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (0.3.0)
Requirement already satisfied: yarl<2.0,>=1.17.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (1.18.3)
Requirement already satisfied: pyarrow>=15.0.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from datasets->vllm==0.7.2+cpu) (19.0.1)
Requirement already satisfied: pandas in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from datasets->vllm==0.7.2+cpu) (2.2.3)
Requirement already satisfied: xxhash in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from datasets->vllm==0.7.2+cpu) (3.5.0)
Requirement already satisfied: multiprocess<0.70.17 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from datasets->vllm==0.7.2+cpu) (0.70.16)
Requirement already satisfied: zipp>=3.20 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from importlib_metadata->vllm==0.7.2+cpu) (3.21.0)
Requirement already satisfied: click>=7.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (8.1.8)
Requirement already satisfied: h11>=0.8 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (0.14.0)
Requirement already satisfied: httptools>=0.6.3 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (0.6.4)
Requirement already satisfied: python-dotenv>=0.13 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (1.0.1)
Requirement already satisfied: uvloop!=0.15.0,!=0.15.1,>=0.14.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (0.21.0)
Requirement already satisfied: watchfiles>=0.13 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (1.0.4)
Requirement already satisfied: websockets>=10.4 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (15.0)
Requirement already satisfied: httpcore==1.* in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from httpx<1,>=0.23.0->openai>=1.52.0->vllm==0.7.2+cpu) (1.0.7)
Requirement already satisfied: jsonschema-specifications>=2023.03.6 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from jsonschema->outlines==0.1.11->vllm==0.7.2+cpu) (2024.10.1)
Requirement already satisfied: rpds-py>=0.7.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from jsonschema->outlines==0.1.11->vllm==0.7.2+cpu) (0.23.1)
Requirement already satisfied: MarkupSafe>=2.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from jinja2->outlines==0.1.11->vllm==0.7.2+cpu) (3.0.2)
Requirement already satisfied: python-dateutil>=2.8.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pandas->datasets->vllm==0.7.2+cpu) (2.9.0.post0)
Requirement already satisfied: pytz>=2020.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pandas->datasets->vllm==0.7.2+cpu) (2025.1)
Requirement already satisfied: tzdata>=2022.7 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pandas->datasets->vllm==0.7.2+cpu) (2025.1)
Building wheels for collected packages: vllm
  Building editable for vllm (pyproject.toml) ... error
  error: subprocess-exited-with-error
  
  × Building editable for vllm (pyproject.toml) did not run successfully.
  │ exit code: 1
  ╰─> [173 lines of output]
      /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/torch/_subclasses/functional_tensor.py:295: UserWarning: Failed to initialize NumPy: No module named 'numpy' (Triggered internally at /Users/runner/work/pytorch/pytorch/pytorch/torch/csrc/utils/tensor_numpy.cpp:84.)
        cpu = _conversion_method_template(device=torch.device("cpu"))
      VLLM_TARGET_DEVICE automatically set to `cpu` due to macOS
      running editable_wheel
      creating /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm.egg-info
      writing /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm.egg-info/PKG-INFO
      writing dependency_links to /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm.egg-info/dependency_links.txt
      writing entry points to /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm.egg-info/entry_points.txt
      writing requirements to /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm.egg-info/requires.txt
      writing top-level names to /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm.egg-info/top_level.txt
      writing manifest file '/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm.egg-info/SOURCES.txt'
      reading manifest template 'MANIFEST.in'
      adding license file 'LICENSE'
      writing manifest file '/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm.egg-info/SOURCES.txt'
      creating '/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm-0.7.2+cpu.dist-info'
      creating /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-wheel-0gh_7xri/.tmp-k7cx31nn/vllm-0.7.2+cpu.dist-info/WHEEL
      running build_py
      running build_ext
      -- The CXX compiler identification is AppleClang 16.0.0.16000026
      -- Detecting CXX compiler ABI info
      -- Detecting CXX compiler ABI info - done
      -- Check for working CXX compiler: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/c++ - skipped
      -- Detecting CXX compile features
      -- Detecting CXX compile features - done
      -- Build type: RelWithDebInfo
      -- Target device: cpu
      -- Found Python: /Users/shengyao/anaconda3/envs/vllm/bin/python (found version "3.12.9") found components: Interpreter Development.Module Development.SABIModule
      -- Found python matching: /Users/shengyao/anaconda3/envs/vllm/bin/python.
      CMake Warning at /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/torch/share/cmake/Torch/TorchConfig.cmake:22 (message):
        static library kineto_LIBRARY-NOTFOUND not found.
      Call Stack (most recent call first):
        /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/torch/share/cmake/Torch/TorchConfig.cmake:120 (append_torchlib_if_found)
        CMakeLists.txt:81 (find_package)
      
      
      -- Found Torch: /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/torch/lib/libtorch.dylib
      -- Apple Silicon Detected
      -- CPU extension compile flags: -Xpreprocessor;-fopenmp;-DVLLM_CPU_EXTENSION
      -- NUMA is disabled
      -- Enabling C extension.
      -- Configuring done (1.2s)
      -- Generating done (0.0s)
      -- Build files have been written to: /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/tmplepo0g_7.build-temp
      [1/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o
      FAILED: CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o
      ccache /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/c++ -DPy_LIMITED_API=3 -DTORCH_EXTENSION_NAME=_C -DUSE_C10D_GLOO -DUSE_DISTRIBUTED -DUSE_RPC -DUSE_TENSORPIPE -DVLLM_NUMA_DISABLED -D_C_EXPORTS -I/Users/shengyao/vllm/csrc -isystem /Users/shengyao/anaconda3/envs/vllm/include/python3.12 -isystem /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/torch/include -isystem /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/torch/include/torch/csrc/api/include -O2 -g -DNDEBUG -std=gnu++17 -arch arm64 -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX15.2.sdk -fPIC -Xpreprocessor -fopenmp -DVLLM_CPU_EXTENSION -MD -MT CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o -MF CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o.d -o CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o -c /Users/shengyao/vllm/csrc/cpu/attention.cpp
      /Users/shengyao/vllm/csrc/cpu/attention.cpp:281:40: error: use of undeclared identifier 'omp_get_max_threads'
        281 |     const int parallel_work_item_num = omp_get_max_threads();
            |                                        ^
      /Users/shengyao/vllm/csrc/cpu/attention.cpp:301:22: error: use of undeclared identifier 'omp_get_thread_num'; did you mean 'at::get_thread_num'?
        301 |             logits + omp_get_thread_num() * max_seq_len_padded;
            |                      ^~~~~~~~~~~~~~~~~~
            |                      at::get_thread_num
      /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/torch/include/ATen/Parallel.h:24:15: note: 'at::get_thread_num' declared here
         24 | TORCH_API int get_thread_num();
            |               ^
      2 errors generated.
      [2/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/utils.cpp.o
      [3/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/layernorm.cpp.o
      [4/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/cache.cpp.o
      [5/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/pos_encoding.cpp.o
      [6/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/activation.cpp.o
      [7/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/torch_bindings.cpp.o
      ninja: build stopped: subcommand failed.
      Traceback (most recent call last):
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/editable_wheel.py", line 139, in run
          self._create_wheel_file(bdist_wheel)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/editable_wheel.py", line 340, in _create_wheel_file
          files, mapping = self._run_build_commands(dist_name, unpacked, lib, tmp)
                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/editable_wheel.py", line 263, in _run_build_commands
          self._run_build_subcommands()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/editable_wheel.py", line 290, in _run_build_subcommands
          self.run_command(name)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/cmd.py", line 339, in run_command
          self.distribution.run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/dist.py", line 999, in run_command
          super().run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py", line 1002, in run_command
          cmd_obj.run()
        File "<string>", line 249, in run
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/build_ext.py", line 99, in run
          _build_ext.run(self)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/command/build_ext.py", line 365, in run
          self.build_extensions()
        File "<string>", line 220, in build_extensions
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/subprocess.py", line 415, in check_call
          raise CalledProcessError(retcode, cmd)
      subprocess.CalledProcessError: Command '['cmake', '--build', '.', '-j=10', '--target=_C']' returned non-zero exit status 1.
      /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py:1002: _DebuggingTips: Problem in editable installation.
      !!
      
              ********************************************************************************
              An error happened while installing `vllm` in editable mode.
      
              The following steps are recommended to help debug this problem:
      
              - Try to install the project normally, without using the editable mode.
                Does the error still persist?
                (If it does, try fixing the problem before attempting the editable mode).
              - If you are using binary extensions, make sure you have all OS-level
                dependencies installed (e.g. compilers, toolchains, binary libraries, ...).
              - Try the latest version of setuptools (maybe the error was already fixed).
              - If you (or your project dependencies) are using any setuptools extension
                or customization, make sure they support the editable mode.
      
              After following the steps above, if the problem still persists and
              you think this is related to how setuptools handles editable installations,
              please submit a reproducible example
              (see https://stackoverflow.com/help/minimal-reproducible-example) to:
      
                  https://github.com/pypa/setuptools/issues
      
              See https://setuptools.pypa.io/en/latest/userguide/development_mode.html for details.
              ********************************************************************************
      
      !!
        cmd_obj.run()
      Traceback (most recent call last):
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 389, in <module>
          main()
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 373, in main
          json_out["return_val"] = hook(**hook_input["kwargs"])
                                   ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 303, in build_editable
          return hook(wheel_directory, config_settings, metadata_directory)
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/build_meta.py", line 476, in build_editable
          return self._build_with_temp_dir(
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/build_meta.py", line 407, in _build_with_temp_dir
          self.run_setup()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/build_meta.py", line 320, in run_setup
          exec(code, locals())
        File "<string>", line 631, in <module>
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/__init__.py", line 117, in setup
          return distutils.core.setup(**attrs)
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/core.py", line 186, in setup
          return run_commands(dist)
                 ^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/core.py", line 202, in run_commands
          dist.run_commands()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py", line 983, in run_commands
          self.run_command(cmd)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/dist.py", line 999, in run_command
          super().run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py", line 1002, in run_command
          cmd_obj.run()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/editable_wheel.py", line 139, in run
          self._create_wheel_file(bdist_wheel)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/editable_wheel.py", line 340, in _create_wheel_file
          files, mapping = self._run_build_commands(dist_name, unpacked, lib, tmp)
                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/editable_wheel.py", line 263, in _run_build_commands
          self._run_build_subcommands()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/editable_wheel.py", line 290, in _run_build_subcommands
          self.run_command(name)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/cmd.py", line 339, in run_command
          self.distribution.run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/dist.py", line 999, in run_command
          super().run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py", line 1002, in run_command
          cmd_obj.run()
        File "<string>", line 249, in run
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/command/build_ext.py", line 99, in run
          _build_ext.run(self)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-wdxq_9mv/overlay/lib/python3.12/site-packages/setuptools/_distutils/command/build_ext.py", line 365, in run
          self.build_extensions()
        File "<string>", line 220, in build_extensions
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/subprocess.py", line 415, in check_call
          raise CalledProcessError(retcode, cmd)
      subprocess.CalledProcessError: Command '['cmake', '--build', '.', '-j=10', '--target=_C']' returned non-zero exit status 1.
      [end of output]
  
  note: This error originates from a subprocess, and is likely not a problem with pip.
  ERROR: Failed building editable for vllm
Failed to build vllm
ERROR: Failed to build installable wheels for some pyproject.toml based projects (vllm)

Before submitting a new issue...

Make sure you already searched for relevant issues, and asked the chatbot living at the bottom right corner of the documentation page, which can answer lots of frequently asked questions.

The text was updated successfully, but these errors were encountered:

hmellor · 2025-02-28T13:25:32Z

Have you:

Tried installing without editable mode, as the error suggests?
Tried reinstalling Command Line Tools for Xcode as suggested in the docs https://docs.vllm.ai/en/latest/getting_started/installation/cpu/index.html?device=apple#build-wheel-from-source?

realShengYao · 2025-02-28T13:32:36Z

Installing with editable mode doens't help. I'll reinstall the Command Line Tools for Xcode and give a try soon.

(vllm) ➜  vllm git:(v0.7.2) pip install .     
Processing /Users/shengyao/vllm
  Installing build dependencies ... done
  Getting requirements to build wheel ... done
  Preparing metadata (pyproject.toml) ... done
Requirement already satisfied: psutil in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (7.0.0)
Requirement already satisfied: sentencepiece in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.2.0)
Requirement already satisfied: numpy<2.0.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.26.4)
Requirement already satisfied: requests>=2.26.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (2.32.3)
Requirement already satisfied: tqdm in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (4.67.1)
Requirement already satisfied: blake3 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.0.4)
Requirement already satisfied: py-cpuinfo in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (9.0.0)
Requirement already satisfied: transformers>=4.48.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (4.49.0)
Requirement already satisfied: tokenizers>=0.19.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.21.0)
Requirement already satisfied: protobuf in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (5.29.3)
Requirement already satisfied: fastapi!=0.113.*,!=0.114.0,>=0.107.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.115.9)
Requirement already satisfied: aiohttp in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (3.11.13)
Requirement already satisfied: openai>=1.52.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.65.1)
Requirement already satisfied: uvicorn[standard] in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.34.0)
Requirement already satisfied: pydantic>=2.9 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (2.10.6)
Requirement already satisfied: prometheus_client>=0.18.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.21.1)
Requirement already satisfied: pillow in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (11.1.0)
Requirement already satisfied: prometheus-fastapi-instrumentator>=7.0.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (7.0.2)
Requirement already satisfied: tiktoken>=0.6.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.9.0)
Requirement already satisfied: lm-format-enforcer<0.11,>=0.10.9 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.10.11)
Requirement already satisfied: outlines==0.1.11 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.1.11)
Requirement already satisfied: lark==1.2.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.2.2)
Requirement already satisfied: typing_extensions>=4.10 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (4.12.2)
Requirement already satisfied: filelock>=3.16.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (3.17.0)
Requirement already satisfied: partial-json-parser in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.2.1.1.post5)
Requirement already satisfied: pyzmq in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (26.2.1)
Requirement already satisfied: msgspec in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.19.0)
Requirement already satisfied: gguf==0.10.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.10.0)
Requirement already satisfied: importlib_metadata in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (8.6.1)
Requirement already satisfied: mistral_common>=1.5.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from mistral_common[opencv]>=1.5.0->vllm==0.7.2+cpu) (1.5.3)
Requirement already satisfied: pyyaml in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (6.0.2)
Requirement already satisfied: six>=1.16.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (1.17.0)
Requirement already satisfied: setuptools>=74.1.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (75.8.0)
Requirement already satisfied: einops in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.8.1)
Requirement already satisfied: compressed-tensors==0.9.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.9.1)
Requirement already satisfied: depyf==0.18.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.18.0)
Requirement already satisfied: cloudpickle in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (3.1.1)
Requirement already satisfied: torch==2.5.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (2.5.1)
Requirement already satisfied: torchaudio in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (2.5.1)
Requirement already satisfied: torchvision in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (0.20.1)
Requirement already satisfied: datasets in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from vllm==0.7.2+cpu) (3.3.2)
Requirement already satisfied: astor in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from depyf==0.18.0->vllm==0.7.2+cpu) (0.8.1)
Requirement already satisfied: dill in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from depyf==0.18.0->vllm==0.7.2+cpu) (0.3.8)
Requirement already satisfied: interegular in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (0.3.3)
Requirement already satisfied: jinja2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (3.1.5)
Requirement already satisfied: nest_asyncio in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (1.6.0)
Requirement already satisfied: diskcache in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (5.6.3)
Requirement already satisfied: referencing in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (0.36.2)
Requirement already satisfied: jsonschema in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (4.23.0)
Requirement already satisfied: pycountry in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (24.6.1)
Requirement already satisfied: airportsdata in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (20250224)
Requirement already satisfied: outlines_core==0.1.26 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from outlines==0.1.11->vllm==0.7.2+cpu) (0.1.26)
Requirement already satisfied: networkx in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from torch==2.5.1->vllm==0.7.2+cpu) (3.4.2)
Requirement already satisfied: fsspec in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from torch==2.5.1->vllm==0.7.2+cpu) (2024.12.0)
Requirement already satisfied: sympy==1.13.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from torch==2.5.1->vllm==0.7.2+cpu) (1.13.1)
Requirement already satisfied: mpmath<1.4,>=1.1.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from sympy==1.13.1->torch==2.5.1->vllm==0.7.2+cpu) (1.3.0)
Requirement already satisfied: starlette<0.46.0,>=0.40.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from fastapi!=0.113.*,!=0.114.0,>=0.107.0->vllm==0.7.2+cpu) (0.45.3)
Requirement already satisfied: packaging in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from lm-format-enforcer<0.11,>=0.10.9->vllm==0.7.2+cpu) (24.2)
Requirement already satisfied: opencv-python-headless>=4.0.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from mistral_common[opencv]>=1.5.0->vllm==0.7.2+cpu) (4.11.0.86)
Requirement already satisfied: anyio<5,>=3.5.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (4.8.0)
Requirement already satisfied: distro<2,>=1.7.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (1.9.0)
Requirement already satisfied: httpx<1,>=0.23.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (0.28.1)
Requirement already satisfied: jiter<1,>=0.4.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (0.8.2)
Requirement already satisfied: sniffio in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from openai>=1.52.0->vllm==0.7.2+cpu) (1.3.1)
Requirement already satisfied: annotated-types>=0.6.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pydantic>=2.9->vllm==0.7.2+cpu) (0.7.0)
Requirement already satisfied: pydantic-core==2.27.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pydantic>=2.9->vllm==0.7.2+cpu) (2.27.2)
Requirement already satisfied: charset-normalizer<4,>=2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from requests>=2.26.0->vllm==0.7.2+cpu) (3.4.1)
Requirement already satisfied: idna<4,>=2.5 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from requests>=2.26.0->vllm==0.7.2+cpu) (3.10)
Requirement already satisfied: urllib3<3,>=1.21.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from requests>=2.26.0->vllm==0.7.2+cpu) (2.3.0)
Requirement already satisfied: certifi>=2017.4.17 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from requests>=2.26.0->vllm==0.7.2+cpu) (2025.1.31)
Requirement already satisfied: regex>=2022.1.18 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from tiktoken>=0.6.0->vllm==0.7.2+cpu) (2024.11.6)
Requirement already satisfied: huggingface-hub<1.0,>=0.16.4 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from tokenizers>=0.19.1->vllm==0.7.2+cpu) (0.29.1)
Requirement already satisfied: safetensors>=0.4.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from transformers>=4.48.2->vllm==0.7.2+cpu) (0.5.3)
Requirement already satisfied: aiohappyeyeballs>=2.3.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (2.4.6)
Requirement already satisfied: aiosignal>=1.1.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (1.3.2)
Requirement already satisfied: attrs>=17.3.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (25.1.0)
Requirement already satisfied: frozenlist>=1.1.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (1.5.0)
Requirement already satisfied: multidict<7.0,>=4.5 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (6.1.0)
Requirement already satisfied: propcache>=0.2.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (0.3.0)
Requirement already satisfied: yarl<2.0,>=1.17.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from aiohttp->vllm==0.7.2+cpu) (1.18.3)
Requirement already satisfied: pyarrow>=15.0.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from datasets->vllm==0.7.2+cpu) (19.0.1)
Requirement already satisfied: pandas in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from datasets->vllm==0.7.2+cpu) (2.2.3)
Requirement already satisfied: xxhash in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from datasets->vllm==0.7.2+cpu) (3.5.0)
Requirement already satisfied: multiprocess<0.70.17 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from datasets->vllm==0.7.2+cpu) (0.70.16)
Requirement already satisfied: zipp>=3.20 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from importlib_metadata->vllm==0.7.2+cpu) (3.21.0)
Requirement already satisfied: click>=7.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (8.1.8)
Requirement already satisfied: h11>=0.8 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (0.14.0)
Requirement already satisfied: httptools>=0.6.3 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (0.6.4)
Requirement already satisfied: python-dotenv>=0.13 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (1.0.1)
Requirement already satisfied: uvloop!=0.15.0,!=0.15.1,>=0.14.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (0.21.0)
Requirement already satisfied: watchfiles>=0.13 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (1.0.4)
Requirement already satisfied: websockets>=10.4 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from uvicorn[standard]->vllm==0.7.2+cpu) (15.0)
Requirement already satisfied: httpcore==1.* in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from httpx<1,>=0.23.0->openai>=1.52.0->vllm==0.7.2+cpu) (1.0.7)
Requirement already satisfied: jsonschema-specifications>=2023.03.6 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from jsonschema->outlines==0.1.11->vllm==0.7.2+cpu) (2024.10.1)
Requirement already satisfied: rpds-py>=0.7.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from jsonschema->outlines==0.1.11->vllm==0.7.2+cpu) (0.23.1)
Requirement already satisfied: MarkupSafe>=2.0 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from jinja2->outlines==0.1.11->vllm==0.7.2+cpu) (3.0.2)
Requirement already satisfied: python-dateutil>=2.8.2 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pandas->datasets->vllm==0.7.2+cpu) (2.9.0.post0)
Requirement already satisfied: pytz>=2020.1 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pandas->datasets->vllm==0.7.2+cpu) (2025.1)
Requirement already satisfied: tzdata>=2022.7 in /Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages (from pandas->datasets->vllm==0.7.2+cpu) (2025.1)
Building wheels for collected packages: vllm
  Building wheel for vllm (pyproject.toml) ... error
  error: subprocess-exited-with-error
  
  × Building wheel for vllm (pyproject.toml) did not run successfully.
  │ exit code: 1
  ╰─> [898 lines of output]
      /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/torch/_subclasses/functional_tensor.py:295: UserWarning: Failed to initialize NumPy: No module named 'numpy' (Triggered internally at /Users/runner/work/pytorch/pytorch/pytorch/torch/csrc/utils/tensor_numpy.cpp:84.)
        cpu = _conversion_method_template(device=torch.device("cpu"))
      VLLM_TARGET_DEVICE automatically set to `cpu` due to macOS
      running bdist_wheel
      running build
      running build_py
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/envs.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/tracing.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/logits_process.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/config.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/version.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/sampling_params.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/_custom_ops.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/_version.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/sequence.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/connections.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/_ipex_ops.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/logger.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/beam_search.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/pooling_params.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/forward_context.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/scripts.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/scalar_type.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      copying vllm/outputs.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1
      copying vllm/v1/request.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1
      copying vllm/v1/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1
      copying vllm/v1/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1
      copying vllm/v1/serial_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1
      copying vllm/v1/kv_cache_interface.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1
      copying vllm/v1/outputs.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/prompt_adapter
      copying vllm/prompt_adapter/models.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/prompt_adapter
      copying vllm/prompt_adapter/request.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/prompt_adapter
      copying vllm/prompt_adapter/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/prompt_adapter
      copying vllm/prompt_adapter/worker_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/prompt_adapter
      copying vllm/prompt_adapter/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/prompt_adapter
      copying vllm/prompt_adapter/layers.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/prompt_adapter
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/attention
      copying vllm/attention/selector.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention
      copying vllm/attention/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention
      copying vllm/attention/layer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/rocm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/neuron.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/hpu.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/cpu.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/interface.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/openvino.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/xpu.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/tpu.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      copying vllm/platforms/cuda.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/platforms
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/core
      copying vllm/core/interfaces.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core
      copying vllm/core/block_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core
      copying vllm/core/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core
      copying vllm/core/evictor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core
      copying vllm/core/scheduler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core
      copying vllm/core/placeholder_block_space_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed
      copying vllm/distributed/parallel_state.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed
      copying vllm/distributed/communication_op.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed
      copying vllm/distributed/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed
      copying vllm/distributed/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/adapter_commons
      copying vllm/adapter_commons/models.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/adapter_commons
      copying vllm/adapter_commons/request.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/adapter_commons
      copying vllm/adapter_commons/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/adapter_commons
      copying vllm/adapter_commons/worker_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/adapter_commons
      copying vllm/adapter_commons/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/adapter_commons
      copying vllm/adapter_commons/layers.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/adapter_commons
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/plugins
      copying vllm/plugins/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/plugins
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/triton_utils
      copying vllm/triton_utils/importing.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/triton_utils
      copying vllm/triton_utils/custom_cache_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/triton_utils
      copying vllm/triton_utils/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/triton_utils
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/logging_utils
      copying vllm/logging_utils/formatter.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/logging_utils
      copying vllm/logging_utils/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/logging_utils
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor
      copying vllm/model_executor/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor
      copying vllm/model_executor/pooling_metadata.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor
      copying vllm/model_executor/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor
      copying vllm/model_executor/sampling_metadata.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor
      copying vllm/model_executor/parameter.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor
      copying vllm/model_executor/custom_op.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/usage
      copying vllm/usage/usage_lib.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/usage
      copying vllm/usage/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/usage
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/medusa_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/mqa_scorer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/draft_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/interfaces.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/metrics.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/util.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/mlp_speculator_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/ngram_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/multi_step_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/proposer_worker_base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/top1_proposer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/batch_expansion.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/target_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/smaller_tp_proposer_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      copying vllm/spec_decode/spec_decode_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/spec_decode
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/registry.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/inputs.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/audio.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/processing.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/parse.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/hasher.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/video.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/image.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      copying vllm/multimodal/profiling.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/multimodal
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints
      copying vllm/entrypoints/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints
      copying vllm/entrypoints/llm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints
      copying vllm/entrypoints/logger.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints
      copying vllm/entrypoints/api_server.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints
      copying vllm/entrypoints/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints
      copying vllm/entrypoints/launcher.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints
      copying vllm/entrypoints/chat_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      copying vllm/transformers_utils/config.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      copying vllm/transformers_utils/detokenizer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      copying vllm/transformers_utils/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      copying vllm/transformers_utils/processor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      copying vllm/transformers_utils/s3_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      copying vllm/transformers_utils/tokenizer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      copying vllm/transformers_utils/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      copying vllm/transformers_utils/detokenizer_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      copying vllm/executor/ray_distributed_executor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      copying vllm/executor/multiproc_worker_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      copying vllm/executor/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      copying vllm/executor/uniproc_executor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      copying vllm/executor/ray_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      copying vllm/executor/executor_base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      copying vllm/executor/mp_distributed_executor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      copying vllm/executor/msgspec_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/executor
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/peft_helper.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/models.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/request.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/fully_sharded_layers.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/worker_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/lora.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      copying vllm/lora/layers.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/profiler
      copying vllm/profiler/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/profiler
      copying vllm/profiler/layerwise_profile.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/profiler
      copying vllm/profiler/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/profiler
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/enc_dec_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/worker_base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/hpu_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/cache_engine.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/pooling_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/hpu_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/cpu_enc_dec_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/cpu_pooling_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/tpu_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/tpu_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/multi_step_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/xpu_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/multi_step_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/multi_step_tpu_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/cpu_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/xpu_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/neuron_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/openvino_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/openvino_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/neuron_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/cpu_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      copying vllm/worker/model_runner_base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/worker
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/device_allocator
      copying vllm/device_allocator/cumem.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/device_allocator
      copying vllm/device_allocator/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/device_allocator
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/inductor_pass.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/vllm_inductor_pass.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/wrapper.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/monitor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/fix_functionalization.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/pass_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/backends.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/reshapes.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/fusion.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/fx_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/multi_output_match.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/counter.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      copying vllm/compilation/decorators.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/compilation
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/assets
      copying vllm/assets/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/assets
      copying vllm/assets/audio.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/assets
      copying vllm/assets/video.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/assets
      copying vllm/assets/image.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/assets
      copying vllm/assets/base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/assets
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      copying vllm/engine/metrics.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      copying vllm/engine/metrics_types.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      copying vllm/engine/protocol.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      copying vllm/engine/llm_engine.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      copying vllm/engine/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      copying vllm/engine/async_timeout.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      copying vllm/engine/arg_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      copying vllm/engine/async_llm_engine.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/inputs
      copying vllm/inputs/preprocess.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/inputs
      copying vllm/inputs/registry.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/inputs
      copying vllm/inputs/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/inputs
      copying vllm/inputs/parse.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/inputs
      copying vllm/inputs/data.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/inputs
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/metrics
      copying vllm/v1/metrics/loggers.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/metrics
      copying vllm/v1/metrics/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/metrics
      copying vllm/v1/metrics/stats.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/metrics
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/attention
      copying vllm/v1/attention/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/attention
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/core
      copying vllm/v1/core/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/core
      copying vllm/v1/core/encoder_cache_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/core
      copying vllm/v1/core/kv_cache_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/core
      copying vllm/v1/core/scheduler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/core
      copying vllm/v1/core/kv_cache_manager.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/core
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/sample
      copying vllm/v1/sample/metadata.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/sample
      copying vllm/v1/sample/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/sample
      copying vllm/v1/sample/sampler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/sample
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/executor
      copying vllm/v1/executor/abstract.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/executor
      copying vllm/v1/executor/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/executor
      copying vllm/v1/executor/multiproc_executor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/executor
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/worker
      copying vllm/v1/worker/block_table.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/worker
      copying vllm/v1/worker/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/worker
      copying vllm/v1/worker/gpu_worker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/worker
      copying vllm/v1/worker/gpu_input_batch.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/worker
      copying vllm/v1/worker/gpu_model_runner.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/worker
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/mm_input_mapper.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/async_llm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/output_processor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/core_client.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/detokenizer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/llm_engine.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/core.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      copying vllm/v1/engine/processor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/engine
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/stats
      copying vllm/v1/stats/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/stats
      copying vllm/v1/stats/common.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/stats
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/attention/backends
      copying vllm/v1/attention/backends/flash_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/attention/backends
      copying vllm/v1/attention/backends/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/attention/backends
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/sample/ops
      copying vllm/v1/sample/ops/penalties.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/sample/ops
      copying vllm/v1/sample/ops/topk_topp_sampler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/sample/ops
      copying vllm/v1/sample/ops/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/v1/sample/ops
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/abstract.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/flash_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/ipex_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/openvino.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/placeholder_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/blocksparse_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/rocm_flash_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/pallas.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/xformers.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/flashinfer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/torch_sdpa.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/triton_mla.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      copying vllm/attention/backends/hpu_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      copying vllm/attention/ops/hpu_paged_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      copying vllm/attention/ops/triton_flash_attention.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      copying vllm/attention/ops/paged_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      copying vllm/attention/ops/ipex_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      copying vllm/attention/ops/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      copying vllm/attention/ops/nki_flash_attn.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      copying vllm/attention/ops/prefix_prefill.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      copying vllm/attention/ops/triton_decode_attention.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends/mla
      copying vllm/attention/backends/mla/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends/mla
      copying vllm/attention/backends/mla/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/backends/mla
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops/blocksparse_attention
      copying vllm/attention/ops/blocksparse_attention/interface.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops/blocksparse_attention
      copying vllm/attention/ops/blocksparse_attention/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops/blocksparse_attention
      copying vllm/attention/ops/blocksparse_attention/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops/blocksparse_attention
      copying vllm/attention/ops/blocksparse_attention/blocksparse_attention_kernel.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/attention/ops/blocksparse_attention
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      copying vllm/core/block/interfaces.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      copying vllm/core/block/block_table.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      copying vllm/core/block/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      copying vllm/core/block/cpu_gpu_block_allocator.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      copying vllm/core/block/common.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      copying vllm/core/block/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      copying vllm/core/block/prefix_caching_block.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      copying vllm/core/block/naive_block.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/core/block
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/custom_all_reduce_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/cuda_wrapper.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/xpu_communicator.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/custom_all_reduce.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/pynccl_wrapper.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/hpu_communicator.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/shm_broadcast.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/pynccl.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      copying vllm/distributed/device_communicators/tpu_communicator.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/device_communicators
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer
      copying vllm/distributed/kv_transfer/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer
      copying vllm/distributed/kv_transfer/kv_transfer_agent.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_connector
      copying vllm/distributed/kv_transfer/kv_connector/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_connector
      copying vllm/distributed/kv_transfer/kv_connector/factory.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_connector
      copying vllm/distributed/kv_transfer/kv_connector/simple_connector.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_connector
      copying vllm/distributed/kv_transfer/kv_connector/base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_connector
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_pipe
      copying vllm/distributed/kv_transfer/kv_pipe/mooncake_pipe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_pipe
      copying vllm/distributed/kv_transfer/kv_pipe/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_pipe
      copying vllm/distributed/kv_transfer/kv_pipe/pynccl_pipe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_pipe
      copying vllm/distributed/kv_transfer/kv_pipe/base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_pipe
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_lookup_buffer
      copying vllm/distributed/kv_transfer/kv_lookup_buffer/simple_buffer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_lookup_buffer
      copying vllm/distributed/kv_transfer/kv_lookup_buffer/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_lookup_buffer
      copying vllm/distributed/kv_transfer/kv_lookup_buffer/base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/distributed/kv_transfer/kv_lookup_buffer
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/logits_processor.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/layernorm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/spec_decode_base_sampler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/linear.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/rejection_sampler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/vocab_parallel_embedding.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/activation.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/rotary_embedding.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/typical_acceptance_sampler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/sampler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/pooler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      copying vllm/model_executor/layers/resampler.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/granitemoe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/interfaces.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/phi3.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/aria.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/internvl.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/qwen2_rm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/glm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/fairseq2_llama.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/dbrx.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/intern_vit.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/qwen2_vl.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/molmo.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/module_mapping.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/gpt_j.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/h2ovl.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/roberta.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/llava_onevision.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/olmo2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/gpt2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/siglip.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/paligemma.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/vision.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/qwen2_5_vl.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/olmoe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/ultravox.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/transformers.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/registry.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/medusa.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/mamba.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/chatglm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/bart.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/internlm2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/pixtral.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/phi3_small.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/arctic.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/starcoder2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/stablelm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/chameleon.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/minicpm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/nemotron.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/opt.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/llava.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/gritlm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/blip.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/mamba_cache.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/interfaces_base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/mllama.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/whisper.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/florence2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/jais.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/llava_next_video.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/llama.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/jamba.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/idefics2_vision_model.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/eagle.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/gemma2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/persimmon.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/glm4_vision_encoder.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/qwen.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/solar.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/fuyu.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/deepseek.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/minicpm3.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/nvlm_d.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/llava_next.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/mpt.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/mlp_speculator.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/phimoe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/orion.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/baichuan.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/telechat2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/mixtral_quant.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/gemma.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/gpt_bigcode.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/minicpmo.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/bert.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/commandr.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/clip.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/decilm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/falcon.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/exaone.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/gpt_neox.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/granite.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/idefics3.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/qwen2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/deepseek_v2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/olmo.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/internlm2_ve.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/minicpmv.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/deepseek_vl2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/mixtral.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/qwen2_moe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/qwen2_audio.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/phi3v.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/phi.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/bloom.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/adapters.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      copying vllm/model_executor/models/blip2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/models
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/guided_decoding
      copying vllm/model_executor/guided_decoding/outlines_logits_processors.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/guided_decoding
      copying vllm/model_executor/guided_decoding/outlines_decoding.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/guided_decoding
      copying vllm/model_executor/guided_decoding/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/guided_decoding
      copying vllm/model_executor/guided_decoding/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/guided_decoding
      copying vllm/model_executor/guided_decoding/xgrammar_decoding.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/guided_decoding
      copying vllm/model_executor/guided_decoding/lm_format_enforcer_decoding.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/guided_decoding
      copying vllm/model_executor/guided_decoding/guided_fields.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/guided_decoding
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/model_loader
      copying vllm/model_executor/model_loader/neuron.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/model_loader
      copying vllm/model_executor/model_loader/weight_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/model_loader
      copying vllm/model_executor/model_loader/openvino.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/model_loader
      copying vllm/model_executor/model_loader/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/model_loader
      copying vllm/model_executor/model_loader/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/model_loader
      copying vllm/model_executor/model_loader/loader.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/model_loader
      copying vllm/model_executor/model_loader/tensorizer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/model_loader
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/mamba
      copying vllm/model_executor/layers/mamba/mamba_mixer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/mamba
      copying vllm/model_executor/layers/mamba/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/mamba
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe
      copying vllm/model_executor/layers/fused_moe/fused_marlin_moe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe
      copying vllm/model_executor/layers/fused_moe/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe
      copying vllm/model_executor/layers/fused_moe/fused_moe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe
      copying vllm/model_executor/layers/fused_moe/moe_torch_iterative.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe
      copying vllm/model_executor/layers/fused_moe/layer.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe
      copying vllm/model_executor/layers/fused_moe/moe_pallas.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/marlin.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/gguf.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/hqq_marlin.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/qqq.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/moe_wna16.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/base_config.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/fp8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/modelopt.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/gptq_marlin.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/tpu_int8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/aqlm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/fbgemm_fp8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/kv_cache.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/awq.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/deepspeedfp.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/gptq.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/bitsandbytes.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/awq_triton.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/gptq_marlin_24.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/neuron_quant.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/awq_marlin.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/ipex_quant.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/experts_int8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      copying vllm/model_executor/layers/quantization/schema.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/mamba/ops
      copying vllm/model_executor/layers/mamba/ops/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/mamba/ops
      copying vllm/model_executor/layers/mamba/ops/mamba_ssm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/mamba/ops
      copying vllm/model_executor/layers/mamba/ops/causal_conv1d.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/mamba/ops
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels
      copying vllm/model_executor/layers/quantization/kernels/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/marlin_utils_test_qqq.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/layer_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/marlin_utils_test.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/fp8_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/marlin_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/marlin_utils_fp8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/quant_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/w8a8_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/machete_utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      copying vllm/model_executor/layers/quantization/utils/marlin_utils_test_24.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark
      copying vllm/model_executor/layers/quantization/quark/quark_moe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark
      copying vllm/model_executor/layers/quantization/quark/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark
      copying vllm/model_executor/layers/quantization/quark/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark
      copying vllm/model_executor/layers/quantization/quark/quark.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors
      copying vllm/model_executor/layers/quantization/compressed_tensors/triton_scaled_mm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors
      copying vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors
      copying vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors
      copying vllm/model_executor/layers/quantization/compressed_tensors/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors
      copying vllm/model_executor/layers/quantization/compressed_tensors/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/scaled_mm
      copying vllm/model_executor/layers/quantization/kernels/scaled_mm/triton.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/scaled_mm
      copying vllm/model_executor/layers/quantization/kernels/scaled_mm/ScaledMMLinearKernel.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/scaled_mm
      copying vllm/model_executor/layers/quantization/kernels/scaled_mm/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/scaled_mm
      copying vllm/model_executor/layers/quantization/kernels/scaled_mm/xla.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/scaled_mm
      copying vllm/model_executor/layers/quantization/kernels/scaled_mm/cutlass.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/scaled_mm
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/mixed_precision
      copying vllm/model_executor/layers/quantization/kernels/mixed_precision/marlin.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/mixed_precision
      copying vllm/model_executor/layers/quantization/kernels/mixed_precision/machete.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/mixed_precision
      copying vllm/model_executor/layers/quantization/kernels/mixed_precision/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/mixed_precision
      copying vllm/model_executor/layers/quantization/kernels/mixed_precision/exllama.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/mixed_precision
      copying vllm/model_executor/layers/quantization/kernels/mixed_precision/MPLinearKernel.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/kernels/mixed_precision
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark/schemes
      copying vllm/model_executor/layers/quantization/quark/schemes/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark/schemes
      copying vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_fp8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark/schemes
      copying vllm/model_executor/layers/quantization/quark/schemes/quark_scheme.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark/schemes
      copying vllm/model_executor/layers/quantization/quark/schemes/quark_w8a8_int8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/quark/schemes
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      copying vllm/model_executor/layers/quantization/compressed_tensors/schemes/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      copying vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a16_fp8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      copying vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_scheme.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      copying vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_fp8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      copying vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w8a8_int8.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      copying vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_24.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      copying vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_wNa16.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      copying vllm/model_executor/layers/quantization/compressed_tensors/schemes/compressed_tensors_w4a16_24.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/compressed_tensors/schemes
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_pooling.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_models.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/cli_args.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_rerank.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/logits_processors.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/protocol.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_embedding.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_chat.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/api_server.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_tokenization.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_engine.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/run_batch.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_completion.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      copying vllm/entrypoints/openai/serving_score.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/llama_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/hermes_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/jamba_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/granite_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/mistral_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/abstract_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/internlm2_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/granite_20b_fc_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      copying vllm/entrypoints/openai/tool_parsers/pythonic_tool_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/tool_parsers
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/reasoning_parsers
      copying vllm/entrypoints/openai/reasoning_parsers/deepseek_r1_reasoning_parser.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/reasoning_parsers
      copying vllm/entrypoints/openai/reasoning_parsers/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/reasoning_parsers
      copying vllm/entrypoints/openai/reasoning_parsers/abs_reasoning_parsers.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/entrypoints/openai/reasoning_parsers
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/tokenizers
      copying vllm/transformers_utils/tokenizers/mistral.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/tokenizers
      copying vllm/transformers_utils/tokenizers/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/tokenizers
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/tokenizer_group
      copying vllm/transformers_utils/tokenizer_group/base_tokenizer_group.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/tokenizer_group
      copying vllm/transformers_utils/tokenizer_group/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/tokenizer_group
      copying vllm/transformers_utils/tokenizer_group/tokenizer_group.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/tokenizer_group
      copying vllm/transformers_utils/tokenizer_group/ray_tokenizer_group.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/tokenizer_group
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/processors
      copying vllm/transformers_utils/processors/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/processors
      copying vllm/transformers_utils/processors/deepseek_vl2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/processors
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/internvl.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/dbrx.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/h2ovl.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/olmo2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/ultravox.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/medusa.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/chatglm.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/arctic.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/nemotron.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/mllama.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/jais.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/eagle.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/cohere2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/solar.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/nvlm_d.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/mpt.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/mlp_speculator.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/telechat2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/falcon.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/exaone.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      copying vllm/transformers_utils/configs/deepseek_vl2.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/transformers_utils/configs
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops
      copying vllm/lora/ops/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/punica_wrapper
      copying vllm/lora/punica_wrapper/punica_base.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/punica_wrapper
      copying vllm/lora/punica_wrapper/punica_cpu.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/punica_wrapper
      copying vllm/lora/punica_wrapper/punica_selector.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/punica_wrapper
      copying vllm/lora/punica_wrapper/punica_hpu.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/punica_wrapper
      copying vllm/lora/punica_wrapper/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/punica_wrapper
      copying vllm/lora/punica_wrapper/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/punica_wrapper
      copying vllm/lora/punica_wrapper/punica_gpu.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/punica_wrapper
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/triton_ops
      copying vllm/lora/ops/triton_ops/sgmv_expand.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/triton_ops
      copying vllm/lora/ops/triton_ops/bgmv_shrink.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/triton_ops
      copying vllm/lora/ops/triton_ops/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/triton_ops
      copying vllm/lora/ops/triton_ops/bgmv_expand.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/triton_ops
      copying vllm/lora/ops/triton_ops/utils.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/triton_ops
      copying vllm/lora/ops/triton_ops/bgmv_expand_slice.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/triton_ops
      copying vllm/lora/ops/triton_ops/sgmv_shrink.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/triton_ops
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/torch_ops
      copying vllm/lora/ops/torch_ops/lora_ops.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/torch_ops
      copying vllm/lora/ops/torch_ops/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/lora/ops/torch_ops
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/multiprocessing
      copying vllm/engine/multiprocessing/client.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/multiprocessing
      copying vllm/engine/multiprocessing/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/multiprocessing
      copying vllm/engine/multiprocessing/engine.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/multiprocessing
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/output_processor
      copying vllm/engine/output_processor/interfaces.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/output_processor
      copying vllm/engine/output_processor/single_step.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/output_processor
      copying vllm/engine/output_processor/util.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/output_processor
      copying vllm/engine/output_processor/__init__.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/output_processor
      copying vllm/engine/output_processor/multi_step.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/output_processor
      copying vllm/engine/output_processor/stop_checker.py -> build/lib.macosx-11.1-arm64-cpython-312/vllm/engine/output_processor
      copying vllm/py.typed -> build/lib.macosx-11.1-arm64-cpython-312/vllm
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=6400,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=7168,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=14336,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=1792,device_name=NVIDIA_A100-SXM4-40GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=3584,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=2048,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=8192,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=8192,device_name=AMD_Instinct_MI300X.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=4096,device_name=AMD_Instinct_MI300X.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=4096,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=3584,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=7168,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=256,N=128,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=4096,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=1344,device_name=NVIDIA_A100-SXM4-40GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=2048,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=1792,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=800,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=64,N=640,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=14336,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=2048,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=1792,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=7168,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=2048,device_name=AMD_Instinct_MI300X.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=64,N=640,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=1792,device_name=AMD_Instinct_MI300X.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=3584,device_name=NVIDIA_A100-SXM4-40GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=2048,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=7168,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=14336,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=16384,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=1344,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=3584,device_name=AMD_Instinct_MI300X.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=14336,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=3584,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=3584,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=1792,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=1344,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=3072,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=16384,device_name=AMD_Instinct_MI300X.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=3584,device_name=NVIDIA_L40S.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=8192,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=3584,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=14336,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=3584,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=1792,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=1792,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=14336,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=2688,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=4096,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=64,N=1280,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=256,N=256,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=3200,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=3584,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=7168,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=3584,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=7168,device_name=NVIDIA_A100-SXM4-80GB,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=14336,device_name=AMD_Instinct_MI300X.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=1792,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=16,N=2688,device_name=NVIDIA_H100_80GB_HBM3.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=4096,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=64,N=1280,device_name=NVIDIA_A100-SXM4-80GB.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=8,N=7168,device_name=AMD_Instinct_MI300X.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      copying vllm/model_executor/layers/fused_moe/configs/E=1,N=3072,device_name=NVIDIA_H100_80GB_HBM3,dtype=int8_w8a16.json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/fused_moe/configs
      creating build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=128,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=4608,K=7168,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=1536,K=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=2304,K=7168,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=2048,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=1152,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=16384,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=24576,K=7168,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=36864,K=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=4096,K=512,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=16384,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=1152,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=2304,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=1536,K=7168,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=18432,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=576,K=7168,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=576,K=7168,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=2048,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=4608,K=7168,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=2048,K=512,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=2304,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=1024,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=32768,K=512,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=18432,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=16384,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=24576,K=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=256,K=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=3072,K=1536,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=3072,K=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=18432,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=2048,K=512,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=2304,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=4608,K=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=32768,K=512,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=1536,K=1536,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=32768,K=512,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=512,K=7168,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=4096,K=512,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=2304,K=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=2048,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=256,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=4096,K=512,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=3072,K=7168,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=36864,K=7168,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=3072,K=1536,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=3072,K=7168,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=1024,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=576,K=7168,device_name=NVIDIA_H100_80GB_HBM3,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=7168,K=256,device_name=NVIDIA_B200,dtype=fp8_w8a8,block_shape=[128, 128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=24576,K=7168,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      copying vllm/model_executor/layers/quantization/utils/configs/N=512,K=7168,device_name=NVIDIA_H200,dtype=fp8_w8a8,block_shape=[128,128].json -> build/lib.macosx-11.1-arm64-cpython-312/vllm/model_executor/layers/quantization/utils/configs
      running build_ext
      -- The CXX compiler identification is AppleClang 16.0.0.16000026
      -- Detecting CXX compiler ABI info
      -- Detecting CXX compiler ABI info - done
      -- Check for working CXX compiler: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/c++ - skipped
      -- Detecting CXX compile features
      -- Detecting CXX compile features - done
      -- Build type: RelWithDebInfo
      -- Target device: cpu
      -- Found Python: /Users/shengyao/anaconda3/envs/vllm/bin/python (found version "3.12.9") found components: Interpreter Development.Module Development.SABIModule
      -- Found python matching: /Users/shengyao/anaconda3/envs/vllm/bin/python.
      CMake Warning at /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/torch/share/cmake/Torch/TorchConfig.cmake:22 (message):
        static library kineto_LIBRARY-NOTFOUND not found.
      Call Stack (most recent call first):
        /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/torch/share/cmake/Torch/TorchConfig.cmake:120 (append_torchlib_if_found)
        CMakeLists.txt:81 (find_package)
      
      
      -- Found Torch: /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/torch/lib/libtorch.dylib
      -- Apple Silicon Detected
      -- CPU extension compile flags: -Xpreprocessor;-fopenmp;-DVLLM_CPU_EXTENSION
      -- NUMA is disabled
      -- Enabling C extension.
      -- Configuring done (1.8s)
      -- Generating done (0.0s)
      -- Build files have been written to: /Users/shengyao/vllm/build/temp.macosx-11.1-arm64-cpython-312
      [1/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o
      FAILED: CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o
      ccache /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/c++ -DPy_LIMITED_API=3 -DTORCH_EXTENSION_NAME=_C -DUSE_C10D_GLOO -DUSE_DISTRIBUTED -DUSE_RPC -DUSE_TENSORPIPE -DVLLM_NUMA_DISABLED -D_C_EXPORTS -I/Users/shengyao/vllm/csrc -isystem /Users/shengyao/anaconda3/envs/vllm/include/python3.12 -isystem /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/torch/include -isystem /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/torch/include/torch/csrc/api/include -O2 -g -DNDEBUG -std=gnu++17 -arch arm64 -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX15.2.sdk -fPIC -Xpreprocessor -fopenmp -DVLLM_CPU_EXTENSION -MD -MT CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o -MF CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o.d -o CMakeFiles/_C.dir/csrc/cpu/attention.cpp.o -c /Users/shengyao/vllm/csrc/cpu/attention.cpp
      /Users/shengyao/vllm/csrc/cpu/attention.cpp:281:40: error: use of undeclared identifier 'omp_get_max_threads'
        281 |     const int parallel_work_item_num = omp_get_max_threads();
            |                                        ^
      /Users/shengyao/vllm/csrc/cpu/attention.cpp:301:22: error: use of undeclared identifier 'omp_get_thread_num'; did you mean 'at::get_thread_num'?
        301 |             logits + omp_get_thread_num() * max_seq_len_padded;
            |                      ^~~~~~~~~~~~~~~~~~
            |                      at::get_thread_num
      /private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/torch/include/ATen/Parallel.h:24:15: note: 'at::get_thread_num' declared here
         24 | TORCH_API int get_thread_num();
            |               ^
      2 errors generated.
      [2/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/utils.cpp.o
      [3/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/layernorm.cpp.o
      [4/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/cache.cpp.o
      [5/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/pos_encoding.cpp.o
      [6/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/activation.cpp.o
      [7/8] Building CXX object CMakeFiles/_C.dir/csrc/cpu/torch_bindings.cpp.o
      ninja: build stopped: subcommand failed.
      Traceback (most recent call last):
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 389, in <module>
          main()
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 373, in main
          json_out["return_val"] = hook(**hook_input["kwargs"])
                                   ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/site-packages/pip/_vendor/pyproject_hooks/_in_process/_in_process.py", line 280, in build_wheel
          return _build_backend().build_wheel(
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/build_meta.py", line 438, in build_wheel
          return _build(['bdist_wheel', '--dist-info-dir', str(metadata_directory)])
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/build_meta.py", line 426, in _build
          return self._build_with_temp_dir(
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/build_meta.py", line 407, in _build_with_temp_dir
          self.run_setup()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/build_meta.py", line 320, in run_setup
          exec(code, locals())
        File "<string>", line 631, in <module>
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/__init__.py", line 117, in setup
          return distutils.core.setup(**attrs)
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/core.py", line 186, in setup
          return run_commands(dist)
                 ^^^^^^^^^^^^^^^^^^
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/core.py", line 202, in run_commands
          dist.run_commands()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py", line 983, in run_commands
          self.run_command(cmd)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/dist.py", line 999, in run_command
          super().run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py", line 1002, in run_command
          cmd_obj.run()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/command/bdist_wheel.py", line 369, in run
          self.run_command("build")
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/cmd.py", line 339, in run_command
          self.distribution.run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/dist.py", line 999, in run_command
          super().run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py", line 1002, in run_command
          cmd_obj.run()
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/command/build.py", line 136, in run
          self.run_command(cmd_name)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/cmd.py", line 339, in run_command
          self.distribution.run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/dist.py", line 999, in run_command
          super().run_command(command)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/dist.py", line 1002, in run_command
          cmd_obj.run()
        File "<string>", line 249, in run
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/command/build_ext.py", line 99, in run
          _build_ext.run(self)
        File "/private/var/folders/y3/3jtypt212bb1qgh729dpkklr0000gn/T/pip-build-env-6oh7kz2o/overlay/lib/python3.12/site-packages/setuptools/_distutils/command/build_ext.py", line 365, in run
          self.build_extensions()
        File "<string>", line 220, in build_extensions
        File "/Users/shengyao/anaconda3/envs/vllm/lib/python3.12/subprocess.py", line 415, in check_call
          raise CalledProcessError(retcode, cmd)
      subprocess.CalledProcessError: Command '['cmake', '--build', '.', '-j=10', '--target=_C']' returned non-zero exit status 1.
      [end of output]
  
  note: This error originates from a subprocess, and is likely not a problem with pip.
  ERROR: Failed building wheel for vllm
Failed to build vllm
ERROR: Failed to build installable wheels for some pyproject.toml based projects (vllm)

realShengYao · 2025-02-28T15:52:55Z

Update: I reinstalled Command Line Tools for Xcode and the problem was not fixed.

I searched for solutions and found that Apple Clang doesn't ship with support for "-fopenmp". For more information, see the discussion from r-project.

I solved the problem by doing following two things:

Install LLVM from brew.
Explicitly include omp.h in csrc/cpu/cpu_types.hpp, see [Bugfix] Explicitly include "omp.h" for MacOS to avoid installation failure #14051 .

We may want to remind users not to use Apple Clang in the docs.

hmellor · 2025-02-28T16:14:03Z

Which version of Apple Clang were you using? The docs say you must use version 15 or newer https://docs.vllm.ai/en/latest/getting_started/installation/cpu/index.html?device=apple#requirements

realShengYao · 2025-02-28T16:16:50Z

I use version 16, you could see from the output of collect_env.py I posted.

OS: macOS 15.3.1 (arm64)
GCC version: Could not collect
Clang version: 16.0.0 (clang-1600.0.26.6)
CMake version: version 3.31.5
Libc version: N/A

hmellor · 2025-02-28T16:20:50Z

Ah, yes I missed that.

It's strange that this has never been reported before. When I have time I'll see if I can install it on my Mac.

realShengYao · 2025-02-28T16:25:31Z

I did a little test with Apple Clang and brew Clang.

#include <stdio.h>
#include "omp.h"

using namespace std;

int main(){
    printf("%d\n", omp_get_max_threads());
}

I tried with Apple Clang and got, it failed to generate executable.

(base) ➜  openmp /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/clang test_openmp.cpp -o test_openmp -fopenmp 
clang: error: unsupported option '-fopenmp'
clang: error: unsupported option '-fopenmp'
(base) ➜  openmp /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/clang --version
Apple clang version 16.0.0 (clang-1600.0.26.6)
Target: arm64-apple-darwin24.3.0
Thread model: posix
InstalledDir: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin

Then I tried with brew Clang and successfully built the executable.

(base) ➜  openmp /opt/homebrew/Cellar/llvm/19.1.7_1/bin/clang test_openmp.cpp -o test_openmp -fopenmp
test_openmp.cpp:4:17: warning: using directive refers to implicitly-defined namespace 'std'
    4 | using namespace std;
      |                 ^
1 warning generated.

Maybe people just never use Apple Clang?

hmellor · 2025-02-28T16:40:28Z

@wallashss could you weigh in as you originally added MacOS support and documented that Apple Clang worked?

wallashss · 2025-02-28T20:33:46Z

Hey everyone,

Sorry to hear you guys are having problems with the buid/install on mac os.

During the development I could build for both brew LLVM and Apple Clang. However I could not make it work right with brew, and the build was insanely more complex to make.

The documentation is right, the working build is for Apple Clang, which some other people could make it work as well. One of the common issue that we identified is that sometimes the environment could not find the standard libraries and the build fails, but for that just reinstall the command line tools should solve it.

I had also similar problems with OpenMP like you report it. The secret sauce to make Apple Clang include OpenMP is use the -Xpreprocessor like in this here. But I didn't test it with Apple Clang 16, so something might had change, and we would need to investigate it.

Add -Xpreprocessor before -fopenmp should fix this:

(base) ➜  openmp /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/clang test_openmp.cpp -o test_openmp -fopenmp 
clang: error: unsupported option '-fopenmp'
clang: error: unsupported option '-fopenmp'

But I suspect that maybe on Clang 16 we have to explicit include OMP headers. This is something that might worth try, from the top of my head I don't remember the exact include. Sorry, I can't test it right now for you.

realShengYao · 2025-03-01T04:02:54Z

Hi Wallashss,

I tried to compile the simple OpenMP with -Xpreprocessor, it works well. And you are right, we just need to explicitly include omp.h, then Apple Clang could successfully compile vLLM.

@hmellor Seems like the only thing we need is to include the header.

realShengYao added the installation Installation problems label Feb 28, 2025

realShengYao linked a pull request Feb 28, 2025 that will close this issue

[Bugfix] Explicitly include "omp.h" for MacOS to avoid installation failure #14051

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Installation]: Can't find OpenMP headers on macOS #14034

[Installation]: Can't find OpenMP headers on macOS #14034

realShengYao commented Feb 28, 2025 •

edited

Loading

hmellor commented Feb 28, 2025

realShengYao commented Feb 28, 2025

realShengYao commented Feb 28, 2025

hmellor commented Feb 28, 2025

realShengYao commented Feb 28, 2025

hmellor commented Feb 28, 2025

realShengYao commented Feb 28, 2025

hmellor commented Feb 28, 2025

wallashss commented Feb 28, 2025

realShengYao commented Mar 1, 2025

[Installation]: Can't find OpenMP headers on macOS #14034

[Installation]: Can't find OpenMP headers on macOS #14034

Comments

realShengYao commented Feb 28, 2025 • edited Loading

Your current environment

How you are installing vllm

Before submitting a new issue...

hmellor commented Feb 28, 2025

realShengYao commented Feb 28, 2025

realShengYao commented Feb 28, 2025

hmellor commented Feb 28, 2025

realShengYao commented Feb 28, 2025

hmellor commented Feb 28, 2025

realShengYao commented Feb 28, 2025

hmellor commented Feb 28, 2025

wallashss commented Feb 28, 2025

realShengYao commented Mar 1, 2025

realShengYao commented Feb 28, 2025 •

edited

Loading