visual genome(visualgenome)

尽管取得了令人印象深刻的进展,但目前的多标签图像识别(MLR)算法在很大程度上依赖于具有完整标签的大规模数据集,使得收集大规模数据集极为耗时和费力。.训练带有部分标签的多标签图像识别模型(MLR-PL)是解决这一问题的另一种方式,在这种情况下,每张图像的部分标签是已知的,而其他标签是未知的(见图1)。.然而,目前的MLP-PL算法主要依靠预先训练好的图像分类或相似性模型来为不知道的标签生成伪标签。.因此,它们依赖于一定量的数据注释,不可避免地会出现明显的性能下降,特别是在已知标签比例较低的情况下。.为了解决这个难题,我们提出了一个统一的语义感知表征混合(SARB),它由两个关键模块组成,在不同的图像中混合多粒度的特定类别语义表征,将已知标签的信息转移到补充未知的标签上。.在MS-COCO、Visual Genome和PascalVOC 2007数据集上进行的大量实验表明,在所有已知的标签比例设置上,所提出的SARB始终优于目前最先进的算法。.具体来说,它得到的平均MAP改进为1.9%, 4.5%, 1.与第二好的算法相比,在三个基准数据集上达到0%。.

《Semantic-Aware Representation Blending for Multi-Label Image Recognition with Partial Labels》

论文地址:http://arxiv.org/abs/2205.13092v1

visual genome(visualgenome)

visual genome(visualgenome)

visual genome(visualgenome)

visual genome(visualgenome)

visual genome(visualgenome)

visual genome(visualgenome)

visual genome(visualgenome)

visual genome(visualgenome)

visual genome(visualgenome)

visual genome(visualgenome)

创业项目群,学习操作 18个小项目,添加 微信:80709525  备注:小项目

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.ya58.com/8378.html