Skip to content

justa-cai/listenai-server

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

44 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ListenAI Server

适合arcs_mini开发板的 多模块 AI 语音服务系统 - 支持 ASR(语音识别)、TTS(语音合成)、VAD(语音活动检测) 等功能

社群

欢迎进群交流

微信社群

模块说明

模块 功能 主要技术 端口
asr/ 实时语音识别服务,支持流式音频输入 FunASR-Nano, WebSocket, TenVAD WS: 9200, HTTP: 9201
tts/ 文本转语音,支持声音克隆和流式输出 VoxCPM-0.5B, WebSocket, 模型推理池 WS: 9300, WebUI: 9301
vad/ 语音活动检测,识别语音段起止 TEN Framework, ONNX -
llm/ 本地大语言模型服务,支持对话、工具调用、流式输出 vLLM, Qwen3-4B, OpenAI兼容API HTTP: 9500
music/ 音乐HTTP服务,AI智能搜索,图片生成 OpenAI API, SiliconFlow, Z-Image-Turbo HTTP: 9100
cloud/ LLM网关,会话管理,MCP工具调用 WebSocket, MCP协议, aiohttp WS: 9400

环境初始化

环境要求

  • Python 3.10.x
  • Linux (推荐 Ubuntu 22.04+)
  • NVIDIA GPU 16G显存以上(推荐4090) + CUDA 12.x

安装python依赖

# 1. 安装 uv (如果未安装)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 创建虚拟环境
uv venv --python 3.10
source .venv/bin/activate

# 3. 安装依赖
uv pip install -r requirements.txt

初始化环境

source .venv/bin/activate

模型下载

ASR

modelscope download --model FunAudioLLM/Fun-ASR-Nano-2512 --local_dir asr/FunAudioLLM/Fun-ASR-Nano-2512

tts

modelscope download --model xiaowangge/voxcpm-0.5b --local_dir tts/VoxCPM-0.5B

llm

modelscope download --model Qwen/Qwen3-4B-Instruct-2507 --local_dir llm/Qwen3-4B-Instruct-2507

music

根据歌词用于封面生成

modelscope download --model Tongyi-MAI/Z-Image-Turbo --local_dir music/Z-Image-Turbo

vad

mkdir -p vad
git clone https://github.com/TEN-framework/ten-vad.git vad/ten-vad

运行服务

ASR

cd asr
sh auto.sh

测试客户端

http://localhost:9201/ 网页测试客户端

TTS

cd tts
sh auto.sh

测试客户端

http://localhost:9301/ 网页测试客户端

CLOUD

cd cloud
sh auto.sh

测试客户端

http://localhost:9401/ 网页测试客户端

MUSIC

cd music
sh auto.sh

音乐放置目录

music/data

提取歌词

cd music
# 可以修改代码,更换成更大的参数量模型,提升提取效果
python3 get_lyrics.py

生成封面

cd music
# 可以修改代码,更换成更大的参数量模型,提升提取效果

python3 generate_images_from_lyrics.py

测试客户端

http://localhost:9100/ 网页测试客户端

LLM

cd llm
# llm的环境不一样,需要使用独立的虚拟环境
source .venv/bin/activate
./Qwen3-4B-Instruct-2507.sh

Star History

Star History Chart

About

配合Arcs-Mini使用,复刻Arcs-Mini云端基本的功能(ASR/TTS(支持声音clone)/LLM(支持本地部署)),自由DIY没有费用负担

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors