目标检测任务

评价指标:

1. 基础核心:IoU (交并比)

IoU 衡量的是模型预测的框(Prediction)和真实的标签框(Ground Truth)的重叠程度。

$IoU = \frac{预测框 \cap 真实框}{预测框 \cup 真实框}$

  • 如果 IoU = 1,说明预测完全重合。

  • 如果 IoU = 0.5,说明预测框和真实框有一半是重合的。


2. mAP@50 的含义与作用

mAP@50(在某些框架如 PASCAL VOC 中也直接简写为 mAP)是指:当 IoU 阈值设为 0.5 时的平均精度。

  • 判定标准: 只要模型预测框与真实框的 IoU 大于 0.5,且类别正确,就认为这个预测是“正确的”(True Positive)。

  • 作用: 它相对比较“宽松”。它主要考察模型有没有定位到物体以及分类是否正确。如果你的应用场景对物体边界的极度精确度要求不高(比如检测路面上的大卡车),mAP@50 是一个非常直观的参考。


3. mAP (COCO 标准) 的含义与作用

在你的 MambaVision 训练日志中,单独出现的 mAP 通常指的是 COCO 标准的 mAP(也写作 mAP@[.50:.95])。

  • 判定标准: 它不是只看某一个阈值,而是计算 IoU 在 0.50, 0.55, 0.60, …, 0.95 这 10 个阈值下的 AP 值,最后再取平均。

  • 作用: 它非常“严苛”。

    • 如果模型只是模糊地圈出了物体,它的 mAP@50 可能很高,但 mAP@75 或 mAP@95 会很低,导致最终平均下来的 mAP 也不高。

    • 它衡量的是模型的综合定位精度。 指标越高,说明模型预测的框与物体边缘贴合得越完美。

mAP@50评价能不能找到目标物体

mAP评价目标对的准不准(预测框和标记框)

综上,我们这里的mAP并不是字面上的mAP,而是 IoU 在 0.50, 0.55, 0.60, …, 0.95 这 10 个阈值下的 AP 值,最后再取平均。而mAP的字面意思是将所有类别的 AP 取平均值。

第二次 共48epoch表现

可视化训练图

由于原文非病理数据集,比较意义不大。

模型配置 (BBox mAP)数据集mAP (综合)mAP@50mAP@75
MambaVision-B (原文)MS COCO54.272.758.9
你的模型 (MambaVision-B)你的病理数据集38.863.840.5
数值差距--15.4-8.9-18.4

第二次训练中各类指标

类别mAPmAP_50mAP_75表现评价
ballooning (球化)0.5810.7700.668极佳 (惊艳)
steatosis (脂肪变性)0.5500.7180.709优秀且极其稳定
fibrosis (纤维化)0.2020.5840.077较差 (定位精准度极低)
inflammation (炎症)0.1830.4150.117极差 (识别与定位双重困难)

关于框架

MMDetection系列,配置好,开箱即用,哪怕是用自己修改的模型(如修改了mambaVison)。

我不用做哪些?

选好相关框架,我不用做“评估”,不用写数据读取和预处理(只需按照指定格式如COCO),不用自己写数据增强,不用针对大图手写切片。

多次实验方法:配置文件

这是最规范的做法。比如:

  • mamba_v1_base.py(基准模型)

  • mamba_v2_modified_block.py(修改了某个模块)

  • mamba_v3_lr001.py(调了学习率)

  • 物理隔离: 框架会自动创建三个文件夹:work_dirs/mamba_v1_base/work_dirs/mamba_v2_modified_block/ 等。

  • 完全独立: 每个实验的权重、日志、备份的配置文件都是独立的。

  • 结论: 强烈建议采用这种方式。 以后写论文时,你只需要对照文件夹名字就能立刻找到对应的数据。