WD 1.4 ConvNextV2 Tagger V2性能评估：F1分数0.6862的标签识别模型详解-酒店常州论坛

WD 1.4 ConvNextV2 Tagger V2性能评估：F1分数0.6862的标签识别模型详解

【免费下载链接】wd-v1-4-convnextv2-tagger-v2项目地址: https://ai.gitcode.com/hf_mirrors/Ding1888/wd-v1-4-convnextv2-tagger-v2

WD 1.4 ConvNextV2 Tagger V2是一款高效的图像标签识别模型，支持评分、角色和通用标签的识别，其F1分数达到0.6862，在图像标签识别领域表现出色。

模型简介 📌

WD 1.4 ConvNextV2 Tagger V2是基于ConvNextV2架构开发的图像标签识别模型。该模型使用SmilingWolf/SW-CV-ModelZoo进行训练，训练过程中使用的TPUs由TRC program友好提供。

训练数据集详情 📊

数据来源与筛选

该模型的训练数据集来源于Danbooru，具体包括：

训练集：图像ID模为0000-0899的Danbooru图像
验证集：图像ID模为0950-0999的Danbooru图像

为保证训练质量，数据集经过严格筛选：

过滤掉通用标签少于10个的图像
过滤掉出现次数少于600次的标签

数据集规模

训练使用的数据集最后图像ID为5944504，确保了模型有足够的数据进行学习和泛化。

模型性能评估 🏆

核心性能指标

在验证集上的表现如下：

最佳阈值：0.3710（当精确率P等于召回率R时）
F1分数：0.6862

这一F1分数表明模型在标签识别任务中实现了精确率和召回率的良好平衡，能够有效识别图像中的各种标签。

支持的标签类型

模型支持多种类型的标签识别，包括：

评分标签（如general、sensitive、questionable、explicit）
角色标签
通用标签（如1girl、solo、long_hair等）

从selected_tags.csv文件中可以看到，模型支持的通用标签非常丰富，涵盖了人物特征、服装、场景等多个方面，前几个高频标签包括1girl（4225150次）、solo（3515897次）、long_hair（2982517次）等。

使用建议 💡

版本选择

由于模型可能会不断更新和改进，建议下游用户使用标记的发布版本，而不是依赖仓库的头部版本，以确保使用的稳定性和一致性。

应用场景

该模型可广泛应用于图像检索、内容推荐、图像分类等领域，帮助用户快速准确地为图像添加标签，提高图像管理和应用的效率。

总结 📝

WD 1.4 ConvNextV2 Tagger V2凭借0.6862的F1分数，在图像标签识别任务中展现了优异的性能。其丰富的标签支持和良好的泛化能力，使其成为图像标签识别领域的一个有力工具。随着模型的不断优化和更新，相信其性能还将进一步提升，为更多应用场景提供支持。

【免费下载链接】wd-v1-4-convnextv2-tagger-v2项目地址: https://ai.gitcode.com/hf_mirrors/Ding1888/wd-v1-4-convnextv2-tagger-v2

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

企业官网建设流程全解析