核心升级

特性	描述
v14 微调模型	lr0=0.0005, 50 epochs, mAP50 0.313 (+72% vs 1.3)
共识过滤 v14	适配新模型置信度分布，primary=0.55, single=0.70
智谱 GLM-4V-Flash	国内免费视觉语言模型，场景分析+异常检测
MAVLink 飞控对接	UDP/Serial/TCP 连接，支持 PX4/ArduPilot
SAHI 大图验证	拼接大图检测数 +68%，推理加速 3-8x
TensorRT INT8 框架	FP16 加速 2.2x (6.0ms)，INT8 校准就绪

性能对比 (VisDrone 100帧)

指标	1.3 融合	1.4 融合	提升
MOTA	0.838	0.858	+2.0pp
IDF1	0.922	0.932	+1.0pp
Recall	0.955	0.973	+1.8pp
FP	431	423	-8
FN	164	99	-65
ID Switches	0	0	✅
推理速度	<50ms	<50ms	—

Assets 2

23 May 13:07

StarlitPupils

v1.3.0

4ec079c

UAVagent 1.3 — VisDrone专训微调模型 + 5引擎TensorRT融合 + MOTA 0.838

概述

UAVagent 1.3 在 1.2 基础上引入三大核心升级：

VisDrone 专训 YOLO11x 微调模型：检测数 +125.9%，Recall 0.990
5 引擎 TensorRT FP16 WBF 融合：推理速度 3x 提升（140ms → <50ms）
自适应共识过滤 v1.3.1 + torchvision ReID + 跟踪器 min_hits 修复

100 帧 MOTA 0.838（+1.3pp vs 1.2），IDF1 0.922（+1.6pp），Recall 0.955（+11.3pp），ID Switches 0。

🚀 核心升级

特性	描述
🎯 VisDrone 专训 YOLO11x	微调训练 21 epochs，检测数 +125.9%，Recall 0.990
⚡ 5 引擎 TensorRT FP16 融合	RTX 4070S 上推理 3x 加速（140ms → <50ms）
🛡️ 自适应共识过滤 v1.3.1	主力模型放宽阈值 primary=0.45，6 轮调参达到平衡
👁️ torchvision ResNet50 ReID	2048 维外观特征，自动降级 HSV
🎬 VLM 视觉推理模块	GPT-4V / Qwen-VL 客户端就绪
📸 定性分析可视化	时间序列检测跟踪效果图生成
🔧 跟踪器 min_hits 修复	消除历史遗留的 5 帧确认延迟

📊 性能对比（VisDrone 100 帧）

指标	1.2 融合	1.3 微调单模型	1.3 融合	vs 1.2
MOTA	0.825	0.609	0.838	+1.3pp
IDF1	0.906	0.835	0.922	+1.6pp
Recall	0.842	0.990	0.955	+11.3pp
Precision	1.000	0.722	0.891	-10.9pp
FP	0	1401	431	可控
FN	579	36	164	-415
ID Switches	0	0	0	✅
推理速度	~140ms	27ms	<50ms	3x ✅

📊 TensorRT 速度基准（RTX 4070S）

模式	单引擎	5 引擎融合	加速比
PyTorch FP32	20.5 ms	~140 ms	1.0x
TensorRT FP16	7.2 ms	<50 ms	2.9x

🔧 主要修复

TensorRT 引擎 "Invalid device id" 错误 — 分离 engine 与 PT 推理路径
5 引擎 WBF 融合路径 — 6 轮迭代，重写 detect 方法兼容 engine
共识过滤过严/过松平衡 — 6 轮调参，终版 primary=0.45, other=0.60
跟踪器 min_hits=5 延迟问题 — 改为 1，消除新轨迹确认延迟
ReID 特征维度冲突 — torchvision 2048 维替代，自动降级 HSV
VisionSystem 融合被单引擎短路 — 调整优先级：Ensemble > 单引擎 > PT

📁 新增文件（20+）

文件	功能
`training/visdrone_to_yolo.py`	VisDrone 标注 → YOLO 格式转换
`training/finetune_yolo11.py`	YOLO11x 微调训练脚本
`training/evaluate_finetuned.py`	微调前后对比评估
`core/edge/tensorrt_exporter.py`	TensorRT 导出、推理、速度基准
`core/llm/vlm_client.py`	VLM 视觉推理客户端（GPT-4V/Qwen-VL）
`core/detection/sahi.py` / `sahi_v2.py` / `sahi_v3.py`	SAHI 切片推理框架（实验性）
`evaluation/temporal_visualizer.py`	时间序列检测跟踪可视化
`run_qualitative_analysis.py`	一键定性分析 + 效果图生成
`benchmark_v13_full.py`	1.3 完整基准测试（30/100帧可切换）
`bench_tensorrt_speed.py`	TensorRT vs PyTorch 速度对比
`det_compare_sahi.py` / `v2` / `v3`	SAHI 检测对比测试

⚠️ 已知局限

SAHI：在 VisDrone（1344×756）上效果不佳，图像尺寸不足以发挥切片优势。已保留为实验性模块，待 DOTA/xView 等大图数据集验证。
微调单模型 FP 高：微调模型自身 Precision 偏低（0.722），但 5 模型融合通过交叉验证将 FP 砍至 431，MOTA 仍受益。
TRT 引擎加载警告：多引擎同时加载时产生 logger 冲突警告，不影响推理结果。

🚀 快速开始

git clone https://github.com/StarlitPupils/UAVagentSystem.git
cd UAVagentSystem
python -m venv venv
venv\Scripts\activate
pip install -r requirements.txt
python main.py

Assets 2