WD 1.4 ConvNextV2 Tagger V2性能评估:F1分数0.6862的标签识别模型详解
【免费下载链接】wd-v1-4-convnextv2-tagger-v2项目地址: https://ai.gitcode.com/hf_mirrors/Ding1888/wd-v1-4-convnextv2-tagger-v2
WD 1.4 ConvNextV2 Tagger V2是一款高效的图像标签识别模型,支持评分、角色和通用标签的识别,其F1分数达到0.6862,在图像标签识别领域表现出色。
模型简介 📌
WD 1.4 ConvNextV2 Tagger V2是基于ConvNextV2架构开发的图像标签识别模型。该模型使用SmilingWolf/SW-CV-ModelZoo进行训练,训练过程中使用的TPUs由TRC program友好提供。
训练数据集详情 📊
数据来源与筛选
该模型的训练数据集来源于Danbooru,具体包括:
- 训练集:图像ID模为0000-0899的Danbooru图像
- 验证集:图像ID模为0950-0999的Danbooru图像
为保证训练质量,数据集经过严格筛选:
- 过滤掉通用标签少于10个的图像
- 过滤掉出现次数少于600次的标签
数据集规模
训练使用的数据集最后图像ID为5944504,确保了模型有足够的数据进行学习和泛化。
模型性能评估 🏆
核心性能指标
在验证集上的表现如下:
- 最佳阈值:0.3710(当精确率P等于召回率R时)
- F1分数:0.6862
这一F1分数表明模型在标签识别任务中实现了精确率和召回率的良好平衡,能够有效识别图像中的各种标签。
支持的标签类型
模型支持多种类型的标签识别,包括:
- 评分标签(如general、sensitive、questionable、explicit)
- 角色标签
- 通用标签(如1girl、solo、long_hair等)
从selected_tags.csv文件中可以看到,模型支持的通用标签非常丰富,涵盖了人物特征、服装、场景等多个方面,前几个高频标签包括1girl(4225150次)、solo(3515897次)、long_hair(2982517次)等。
使用建议 💡
版本选择
由于模型可能会不断更新和改进,建议下游用户使用标记的发布版本,而不是依赖仓库的头部版本,以确保使用的稳定性和一致性。
应用场景
该模型可广泛应用于图像检索、内容推荐、图像分类等领域,帮助用户快速准确地为图像添加标签,提高图像管理和应用的效率。
总结 📝
WD 1.4 ConvNextV2 Tagger V2凭借0.6862的F1分数,在图像标签识别任务中展现了优异的性能。其丰富的标签支持和良好的泛化能力,使其成为图像标签识别领域的一个有力工具。随着模型的不断优化和更新,相信其性能还将进一步提升,为更多应用场景提供支持。
【免费下载链接】wd-v1-4-convnextv2-tagger-v2项目地址: https://ai.gitcode.com/hf_mirrors/Ding1888/wd-v1-4-convnextv2-tagger-v2
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考