Releases: StarlitPupils/UAVagentSystem
Releases · StarlitPupils/UAVagentSystem
UAVagent1.4.0 12 Agent + v14微调模型(mAP +72%) + SAHI大图验证 + 智谱GLM-4V-Flash免费VLM + MAVLink飞控对接 + TRT INT8框架 + 自适应阈值(实验) + 共识过滤v14校准
24 May 10:59
Compare
Sorry, something went wrong.
No results found
核心升级
特性
描述
v14 微调模型
lr0=0.0005, 50 epochs, mAP50 0.313 (+72% vs 1.3)
共识过滤 v14
适配新模型置信度分布,primary=0.55, single=0.70
智谱 GLM-4V-Flash
国内免费视觉语言模型,场景分析+异常检测
MAVLink 飞控对接
UDP/Serial/TCP 连接,支持 PX4/ArduPilot
SAHI 大图验证
拼接大图检测数 +68%,推理加速 3-8x
TensorRT INT8 框架
FP16 加速 2.2x (6.0ms),INT8 校准就绪
性能对比 (VisDrone 100帧)
指标
1.3 融合
1.4 融合
提升
MOTA
0.838
0.858
+2.0pp
IDF1
0.922
0.932
+1.0pp
Recall
0.955
0.973
+1.8pp
FP
431
423
-8
FN
164
99
-65
ID Switches
0
0
✅
推理速度
<50ms
<50ms
—
UAVagent 1.3 — VisDrone专训微调模型 + 5引擎TensorRT融合 + MOTA 0.838
23 May 13:07
Compare
Sorry, something went wrong.
No results found
概述
UAVagent 1.3 在 1.2 基础上引入三大核心升级:
VisDrone 专训 YOLO11x 微调模型 :检测数 +125.9%,Recall 0.990
5 引擎 TensorRT FP16 WBF 融合 :推理速度 3x 提升(140ms → <50ms)
自适应共识过滤 v1.3.1 + torchvision ReID + 跟踪器 min_hits 修复
100 帧 MOTA 0.838 (+1.3pp vs 1.2),IDF1 0.922 (+1.6pp),Recall 0.955 (+11.3pp),ID Switches 0 。
🚀 核心升级
特性
描述
🎯 VisDrone 专训 YOLO11x
微调训练 21 epochs,检测数 +125.9%,Recall 0.990
⚡ 5 引擎 TensorRT FP16 融合
RTX 4070S 上推理 3x 加速(140ms → <50ms)
🛡️ 自适应共识过滤 v1.3.1
主力模型放宽阈值 primary=0.45,6 轮调参达到平衡
👁️ torchvision ResNet50 ReID
2048 维外观特征,自动降级 HSV
🎬 VLM 视觉推理模块
GPT-4V / Qwen-VL 客户端就绪
📸 定性分析可视化
时间序列检测跟踪效果图生成
🔧 跟踪器 min_hits 修复
消除历史遗留的 5 帧确认延迟
📊 性能对比(VisDrone 100 帧)
指标
1.2 融合
1.3 微调单模型
1.3 融合
vs 1.2
MOTA
0.825
0.609
0.838
+1.3pp
IDF1
0.906
0.835
0.922
+1.6pp
Recall
0.842
0.990
0.955
+11.3pp
Precision
1.000
0.722
0.891
-10.9pp
FP
0
1401
431
可控
FN
579
36
164
-415
ID Switches
0
0
0
✅
推理速度
~140ms
27ms
<50ms
3x ✅
📊 TensorRT 速度基准(RTX 4070S)
模式
单引擎
5 引擎融合
加速比
PyTorch FP32
20.5 ms
~140 ms
1.0x
TensorRT FP16
7.2 ms
<50 ms
2.9x
🔧 主要修复
TensorRT 引擎 "Invalid device id" 错误 — 分离 engine 与 PT 推理路径
5 引擎 WBF 融合路径 — 6 轮迭代,重写 detect 方法兼容 engine
共识过滤过严/过松平衡 — 6 轮调参,终版 primary=0.45, other=0.60
跟踪器 min_hits=5 延迟问题 — 改为 1,消除新轨迹确认延迟
ReID 特征维度冲突 — torchvision 2048 维替代,自动降级 HSV
VisionSystem 融合被单引擎短路 — 调整优先级:Ensemble > 单引擎 > PT
📁 新增文件(20+)
文件
功能
training/visdrone_to_yolo.py
VisDrone 标注 → YOLO 格式转换
training/finetune_yolo11.py
YOLO11x 微调训练脚本
training/evaluate_finetuned.py
微调前后对比评估
core/edge/tensorrt_exporter.py
TensorRT 导出、推理、速度基准
core/llm/vlm_client.py
VLM 视觉推理客户端(GPT-4V/Qwen-VL)
core/detection/sahi.py / sahi_v2.py / sahi_v3.py
SAHI 切片推理框架(实验性)
evaluation/temporal_visualizer.py
时间序列检测跟踪可视化
run_qualitative_analysis.py
一键定性分析 + 效果图生成
benchmark_v13_full.py
1.3 完整基准测试(30/100帧可切换)
bench_tensorrt_speed.py
TensorRT vs PyTorch 速度对比
det_compare_sahi.py / v2 / v3
SAHI 检测对比测试
⚠️ 已知局限
SAHI :在 VisDrone(1344×756)上效果不佳,图像尺寸不足以发挥切片优势。已保留为实验性模块,待 DOTA/xView 等大图数据集验证。
微调单模型 FP 高 :微调模型自身 Precision 偏低(0.722),但 5 模型融合通过交叉验证将 FP 砍至 431,MOTA 仍受益。
TRT 引擎加载警告 :多引擎同时加载时产生 logger 冲突警告,不影响推理结果。
🚀 快速开始
git clone https://github.com/StarlitPupils/UAVagentSystem.git
cd UAVagentSystem
python -m venv venv
venv\S cripts\a ctivate
pip install -r requirements.txt
python main.py
UAVagent 1.2.0 — 多模型融合MOTA超越0.825
19 May 11:11
Compare
Sorry, something went wrong.
No results found
🚀 1.2 重大升级
📊 VisDrone 100帧基准
指标
1.1 融合
1.2 融合
提升
MOTA
0.784
0.825
+4.1pp
IDF1
0.880
0.906
+2.6pp
Recall
0.898
0.842
精度优先
ID Sw
0
0
✅ 完美
✨ 新特性
🔍 5模型集成 : YOLO11x + YOLO8x + YOLO11n + YOLO10n + RT-DETR-l
🎨 CLAHE预处理 : 低光照/雾霾自适应增强
📈 EKF跟踪 : 扩展卡尔曼 + HSV外观 + 轨迹插值
🤖 Ollama本地LLM : 离线推理 + 智能路由
🔄 ReAct多轮推理 : Thought→Action→Observation
🛡️ 质量门控 : 异常模型自动熔断
🔧 修复
卡尔曼滤波数组越界
特征维度冲突导致跟踪崩溃
共识过滤过度移除
UAVagent 1.1 — 12 Agent + 3模型WBF + ChromaDB记忆
19 May 11:15
Compare
Sorry, something went wrong.
No results found
UAVagent 1.1 核心升级
12 Agent 多智能体协同
3模型 WBF 融合检测
卡尔曼8状态 + HSV 外观跟踪
ChromaDB 向量记忆库
VisDrone 100帧: MOTA 0.784
文件清单
见仓库 v1.1.0 tag 下的源码。