本地部署疑问 #81

1NormalGuy · 2025-02-04T01:12:12Z

根据教程在window11 RTX 3060和macos M1下均无法实现本地部署，请问有更详细的本地部署教程吗？

LindiaC · 2025-02-09T11:08:21Z

+1, vllm在windows系统下会报错，还有没有别的替代方案？

Hwwwww-dev · 2025-02-12T03:54:51Z

根据教程在window11 RTX 3060和macos M1下均无法实现本地部署，请问有更详细的本地部署教程吗？

我直接 clone vllm 项目，然后起 vllm server 是运行起来了，无奈 M1 Pro 推理太慢了...

AHEADer · 2025-02-13T14:56:12Z

我们实际发现ollama运行qwen2-vl模型会有明显的模型性能损失，而且ollama对bf16的支持也有限；vLLM的话可能更推荐使用CUDA+Linux的环境，如果有对应的推理问题，也可以去ollama和vLLM的仓库提issues。

ycjcl868 added the model label Feb 12, 2025

Provide feedback