WD 1.4 ConvNextV2 Tagger V2性能评估:F1分数0.6862的标签识别模型详解
2026/6/3 11:24:02 网站建设 项目流程

WD 1.4 ConvNextV2 Tagger V2性能评估:F1分数0.6862的标签识别模型详解

【免费下载链接】wd-v1-4-convnextv2-tagger-v2项目地址: https://ai.gitcode.com/hf_mirrors/Ding1888/wd-v1-4-convnextv2-tagger-v2

WD 1.4 ConvNextV2 Tagger V2是一款高效的图像标签识别模型,支持评分、角色和通用标签的识别,其F1分数达到0.6862,在图像标签识别领域表现出色。

模型简介 📌

WD 1.4 ConvNextV2 Tagger V2是基于ConvNextV2架构开发的图像标签识别模型。该模型使用SmilingWolf/SW-CV-ModelZoo进行训练,训练过程中使用的TPUs由TRC program友好提供。

训练数据集详情 📊

数据来源与筛选

该模型的训练数据集来源于Danbooru,具体包括:

  • 训练集:图像ID模为0000-0899的Danbooru图像
  • 验证集:图像ID模为0950-0999的Danbooru图像

为保证训练质量,数据集经过严格筛选:

  • 过滤掉通用标签少于10个的图像
  • 过滤掉出现次数少于600次的标签

数据集规模

训练使用的数据集最后图像ID为5944504,确保了模型有足够的数据进行学习和泛化。

模型性能评估 🏆

核心性能指标

在验证集上的表现如下:

  • 最佳阈值:0.3710(当精确率P等于召回率R时)
  • F1分数:0.6862

这一F1分数表明模型在标签识别任务中实现了精确率和召回率的良好平衡,能够有效识别图像中的各种标签。

支持的标签类型

模型支持多种类型的标签识别,包括:

  • 评分标签(如general、sensitive、questionable、explicit)
  • 角色标签
  • 通用标签(如1girl、solo、long_hair等)

从selected_tags.csv文件中可以看到,模型支持的通用标签非常丰富,涵盖了人物特征、服装、场景等多个方面,前几个高频标签包括1girl(4225150次)、solo(3515897次)、long_hair(2982517次)等。

使用建议 💡

版本选择

由于模型可能会不断更新和改进,建议下游用户使用标记的发布版本,而不是依赖仓库的头部版本,以确保使用的稳定性和一致性。

应用场景

该模型可广泛应用于图像检索、内容推荐、图像分类等领域,帮助用户快速准确地为图像添加标签,提高图像管理和应用的效率。

总结 📝

WD 1.4 ConvNextV2 Tagger V2凭借0.6862的F1分数,在图像标签识别任务中展现了优异的性能。其丰富的标签支持和良好的泛化能力,使其成为图像标签识别领域的一个有力工具。随着模型的不断优化和更新,相信其性能还将进一步提升,为更多应用场景提供支持。

【免费下载链接】wd-v1-4-convnextv2-tagger-v2项目地址: https://ai.gitcode.com/hf_mirrors/Ding1888/wd-v1-4-convnextv2-tagger-v2

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询