文章预览
传统的目标检测模型通常受到其训练数据和定义的类别逻辑的限制。随着语言-视觉模型的近期兴起,出现了不受这些固定类别限制的新方法。尽管这些开放词汇检测模型具有灵活性,但与传统的固定类别模型相比,仍然在准确性上存在不足。同时,更加准确的数据特定模型在需要扩展类别或合并不同数据集进行训练时面临挑战。后者通常由于逻辑或冲突的类别定义而无法组合,这使得在不损害模型性能的情况下提升模型变得困难。 CerberusDet 是一个旨在处理多目标检测任务的多头模型框架,该模型基于 YOLO 架构,能够有效地共享来自主干和 NECK 部分组件的视觉特征,同时保持独立的任务头。这种方法使得 CerberusDet 能够高效地执行,同时仍然提供最佳结果。 在 PASCAL VOC 数据集和 Objects365 数据集上评估了该模型,以展示其能力。 CerberusDet 实现了最先
………………………………