Skip to content

Releases: StarlitPupils/UAVagentSystem

UAVagent1.4.0 12 Agent + v14微调模型(mAP +72%) + SAHI大图验证 + 智谱GLM-4V-Flash免费VLM + MAVLink飞控对接 + TRT INT8框架 + 自适应阈值(实验) + 共识过滤v14校准

24 May 10:59

Choose a tag to compare

核心升级

特性 描述
v14 微调模型 lr0=0.0005, 50 epochs, mAP50 0.313 (+72% vs 1.3)
共识过滤 v14 适配新模型置信度分布,primary=0.55, single=0.70
智谱 GLM-4V-Flash 国内免费视觉语言模型,场景分析+异常检测
MAVLink 飞控对接 UDP/Serial/TCP 连接,支持 PX4/ArduPilot
SAHI 大图验证 拼接大图检测数 +68%,推理加速 3-8x
TensorRT INT8 框架 FP16 加速 2.2x (6.0ms),INT8 校准就绪

性能对比 (VisDrone 100帧)

指标 1.3 融合 1.4 融合 提升
MOTA 0.838 0.858 +2.0pp
IDF1 0.922 0.932 +1.0pp
Recall 0.955 0.973 +1.8pp
FP 431 423 -8
FN 164 99 -65
ID Switches 0 0
推理速度 <50ms <50ms

UAVagent 1.3 — VisDrone专训微调模型 + 5引擎TensorRT融合 + MOTA 0.838

23 May 13:07
4ec079c

Choose a tag to compare

概述

UAVagent 1.3 在 1.2 基础上引入三大核心升级:

  • VisDrone 专训 YOLO11x 微调模型:检测数 +125.9%,Recall 0.990
  • 5 引擎 TensorRT FP16 WBF 融合:推理速度 3x 提升(140ms → <50ms)
  • 自适应共识过滤 v1.3.1 + torchvision ReID + 跟踪器 min_hits 修复

100 帧 MOTA 0.838(+1.3pp vs 1.2),IDF1 0.922(+1.6pp),Recall 0.955(+11.3pp),ID Switches 0


🚀 核心升级

特性 描述
🎯 VisDrone 专训 YOLO11x 微调训练 21 epochs,检测数 +125.9%,Recall 0.990
5 引擎 TensorRT FP16 融合 RTX 4070S 上推理 3x 加速(140ms → <50ms)
🛡️ 自适应共识过滤 v1.3.1 主力模型放宽阈值 primary=0.45,6 轮调参达到平衡
👁️ torchvision ResNet50 ReID 2048 维外观特征,自动降级 HSV
🎬 VLM 视觉推理模块 GPT-4V / Qwen-VL 客户端就绪
📸 定性分析可视化 时间序列检测跟踪效果图生成
🔧 跟踪器 min_hits 修复 消除历史遗留的 5 帧确认延迟

📊 性能对比(VisDrone 100 帧)

指标 1.2 融合 1.3 微调单模型 1.3 融合 vs 1.2
MOTA 0.825 0.609 0.838 +1.3pp
IDF1 0.906 0.835 0.922 +1.6pp
Recall 0.842 0.990 0.955 +11.3pp
Precision 1.000 0.722 0.891 -10.9pp
FP 0 1401 431 可控
FN 579 36 164 -415
ID Switches 0 0 0
推理速度 ~140ms 27ms <50ms 3x

📊 TensorRT 速度基准(RTX 4070S)

模式 单引擎 5 引擎融合 加速比
PyTorch FP32 20.5 ms ~140 ms 1.0x
TensorRT FP16 7.2 ms <50 ms 2.9x

🔧 主要修复

  • TensorRT 引擎 "Invalid device id" 错误 — 分离 engine 与 PT 推理路径
  • 5 引擎 WBF 融合路径 — 6 轮迭代,重写 detect 方法兼容 engine
  • 共识过滤过严/过松平衡 — 6 轮调参,终版 primary=0.45, other=0.60
  • 跟踪器 min_hits=5 延迟问题 — 改为 1,消除新轨迹确认延迟
  • ReID 特征维度冲突 — torchvision 2048 维替代,自动降级 HSV
  • VisionSystem 融合被单引擎短路 — 调整优先级:Ensemble > 单引擎 > PT

📁 新增文件(20+)

文件 功能
training/visdrone_to_yolo.py VisDrone 标注 → YOLO 格式转换
training/finetune_yolo11.py YOLO11x 微调训练脚本
training/evaluate_finetuned.py 微调前后对比评估
core/edge/tensorrt_exporter.py TensorRT 导出、推理、速度基准
core/llm/vlm_client.py VLM 视觉推理客户端(GPT-4V/Qwen-VL)
core/detection/sahi.py / sahi_v2.py / sahi_v3.py SAHI 切片推理框架(实验性)
evaluation/temporal_visualizer.py 时间序列检测跟踪可视化
run_qualitative_analysis.py 一键定性分析 + 效果图生成
benchmark_v13_full.py 1.3 完整基准测试(30/100帧可切换)
bench_tensorrt_speed.py TensorRT vs PyTorch 速度对比
det_compare_sahi.py / v2 / v3 SAHI 检测对比测试

⚠️ 已知局限

  • SAHI:在 VisDrone(1344×756)上效果不佳,图像尺寸不足以发挥切片优势。已保留为实验性模块,待 DOTA/xView 等大图数据集验证。
  • 微调单模型 FP 高:微调模型自身 Precision 偏低(0.722),但 5 模型融合通过交叉验证将 FP 砍至 431,MOTA 仍受益。
  • TRT 引擎加载警告:多引擎同时加载时产生 logger 冲突警告,不影响推理结果。

🚀 快速开始

git clone https://github.com/StarlitPupils/UAVagentSystem.git
cd UAVagentSystem
python -m venv venv
venv\Scripts\activate
pip install -r requirements.txt
python main.py

UAVagent 1.2.0 — 多模型融合MOTA超越0.825

19 May 11:11

Choose a tag to compare

🚀 1.2 重大升级

📊 VisDrone 100帧基准

指标 1.1 融合 1.2 融合 提升
MOTA 0.784 0.825 +4.1pp
IDF1 0.880 0.906 +2.6pp
Recall 0.898 0.842 精度优先
ID Sw 0 0 ✅ 完美

✨ 新特性

  • 🔍 5模型集成: YOLO11x + YOLO8x + YOLO11n + YOLO10n + RT-DETR-l
  • 🎨 CLAHE预处理: 低光照/雾霾自适应增强
  • 📈 EKF跟踪: 扩展卡尔曼 + HSV外观 + 轨迹插值
  • 🤖 Ollama本地LLM: 离线推理 + 智能路由
  • 🔄 ReAct多轮推理: Thought→Action→Observation
  • 🛡️ 质量门控: 异常模型自动熔断

🔧 修复

  • 卡尔曼滤波数组越界
  • 特征维度冲突导致跟踪崩溃
  • 共识过滤过度移除

UAVagent 1.1 — 12 Agent + 3模型WBF + ChromaDB记忆

19 May 11:15

Choose a tag to compare

UAVagent 1.1 核心升级

  • 12 Agent 多智能体协同
  • 3模型 WBF 融合检测
  • 卡尔曼8状态 + HSV 外观跟踪
  • ChromaDB 向量记忆库
  • VisDrone 100帧: MOTA 0.784

文件清单

见仓库 v1.1.0 tag 下的源码。