目标检测任务
评价指标:
1. 基础核心:IoU (交并比)
IoU 衡量的是模型预测的框(Prediction)和真实的标签框(Ground Truth)的重叠程度。
$IoU = \frac{预测框 \cap 真实框}{预测框 \cup 真实框}$
如果 IoU = 1,说明预测完全重合。
如果 IoU = 0.5,说明预测框和真实框有一半是重合的。
2. mAP@50 的含义与作用
mAP@50(在某些框架如 PASCAL VOC 中也直接简写为 mAP)是指:当 IoU 阈值设为 0.5 时的平均精度。
判定标准: 只要模型预测框与真实框的 IoU 大于 0.5,且类别正确,就认为这个预测是“正确的”(True Positive)。
作用: 它相对比较“宽松”。它主要考察模型有没有定位到物体以及分类是否正确。如果你的应用场景对物体边界的极度精确度要求不高(比如检测路面上的大卡车),mAP@50 是一个非常直观的参考。
3. mAP (COCO 标准) 的含义与作用
在你的 MambaVision 训练日志中,单独出现的 mAP 通常指的是 COCO 标准的 mAP(也写作 mAP@[.50:.95])。
判定标准: 它不是只看某一个阈值,而是计算 IoU 在 0.50, 0.55, 0.60, …, 0.95 这 10 个阈值下的 AP 值,最后再取平均。
作用: 它非常“严苛”。
如果模型只是模糊地圈出了物体,它的 mAP@50 可能很高,但 mAP@75 或 mAP@95 会很低,导致最终平均下来的
mAP也不高。它衡量的是模型的综合定位精度。 指标越高,说明模型预测的框与物体边缘贴合得越完美。
mAP@50评价能不能找到目标物体
mAP评价目标对的准不准(预测框和标记框)
综上,我们这里的mAP并不是字面上的mAP,而是 IoU 在 0.50, 0.55, 0.60, …, 0.95 这 10 个阈值下的 AP 值,最后再取平均。而mAP的字面意思是将所有类别的 AP 取平均值。
第二次 共48epoch表现
可视化训练图
由于原文非病理数据集,比较意义不大。
| 模型配置 (BBox mAP) | 数据集 | mAP (综合) | mAP@50 | mAP@75 |
|---|---|---|---|---|
| MambaVision-B (原文) | MS COCO | 54.2 | 72.7 | 58.9 |
| 你的模型 (MambaVision-B) | 你的病理数据集 | 38.8 | 63.8 | 40.5 |
| 数值差距 | - | -15.4 | -8.9 | -18.4 |
第二次训练中各类指标
| 类别 | mAP | mAP_50 | mAP_75 | 表现评价 |
|---|---|---|---|---|
| ballooning (球化) | 0.581 | 0.770 | 0.668 | 极佳 (惊艳) |
| steatosis (脂肪变性) | 0.550 | 0.718 | 0.709 | 优秀且极其稳定 |
| fibrosis (纤维化) | 0.202 | 0.584 | 0.077 | 较差 (定位精准度极低) |
| inflammation (炎症) | 0.183 | 0.415 | 0.117 | 极差 (识别与定位双重困难) |
关于框架
MMDetection系列,配置好,开箱即用,哪怕是用自己修改的模型(如修改了mambaVison)。
我不用做哪些?
选好相关框架,我不用做“评估”,不用写数据读取和预处理(只需按照指定格式如COCO),不用自己写数据增强,不用针对大图手写切片。
多次实验方法:配置文件
这是最规范的做法。比如:
mamba_v1_base.py(基准模型)mamba_v2_modified_block.py(修改了某个模块)mamba_v3_lr001.py(调了学习率)物理隔离: 框架会自动创建三个文件夹:
work_dirs/mamba_v1_base/、work_dirs/mamba_v2_modified_block/等。完全独立: 每个实验的权重、日志、备份的配置文件都是独立的。
结论: 强烈建议采用这种方式。 以后写论文时,你只需要对照文件夹名字就能立刻找到对应的数据。
