AI-Chat-WebUI 项目简介

部署一个聊天前端页面，在后端调用本地部署的通义千问 AI 大模型进行问答

文件夹介绍

前端启动：npm run dev
后端启动：直接运行 springboot 主类
vLLM 启动：python -m vllm.entrypoints.openai.api_server --model /home/chengwch/Code/llm_project/llm-model/models/Qwen/Qwen2-0___5B-Instruct --port 8082
fastAPI 启动：python fastapi_sse_localmodel.py（如果本地无法启动大模型，可以使用 python fastapi_sse.py或python fastapi_sse_num.py 代替，作为模拟输出）

vLLM 只能在 Linux 上面运行，最低支持 cuda 版本为 11.8，推荐使用 cuda12.1，参考：https://docs.vllm.ai/en/latest/getting_started/installation.html

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
llm-backend		llm-backend
llm-frontend		llm-frontend
llm-model		llm-model
.gitignore		.gitignore
README.md		README.md