Qwen3.5:9B 微调保姆级教程，看完就能直接套用-酒店常州论坛

本文详细介绍了如何使用 Unsloth Studio 平台对 Qwen3.5:9B 模型进行微调，特别针对客服场景进行了优化。文章从选择 9B 模型的原因、客服数据集模板、训练前准备、LoRA 配置、训练参数设置、效果验证、导出到 Ollama 以及微调避坑清单等方面进行了全面阐述。作者强调数据质量对微调效果的重要性，并提供了一套完整的解决方案，帮助读者在实际业务中实现高效的模型微调。

之前我写过用 Unsloth Studio 跑 4B 微调，又对照了 LlamaFactory，有人私信问：

“4B 跑通了，9B 我自己显卡能不能跑？” “训练数据格式我搞不清楚，到底要长什么样？”

这周用真实客服数据从 0 到 1 微调了 Qwen3.5:9b，跑通整个流程，RTX 4060 8GB 显存正好能上，下面把完整数据模板、超参、显存优化、效果验证都拆给你，看完就能直接套到你自己业务。

一、为什么是 9B 而不是 4B

之前那篇说"显存吃紧选 4B"。但只要你显存到 8GB（4060 / 4070 / 3060 12G 都行），9B 强烈优于 4B：

维度	qwen3.5:4b 微调后	qwen3.5:9b 微调后
客服对话流畅度	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
业务术语理解	⭐⭐⭐ 偶尔走偏	⭐⭐⭐⭐⭐ 几乎不出错
复杂多轮对话	⭐⭐⭐ 三轮后失焦	⭐⭐⭐⭐⭐ 八轮稳定
拒答边界	⭐⭐⭐ 偶尔乱编	⭐⭐⭐⭐⭐ 不知道就说不知道
训练耗时（500条）	38 分钟	1 小时 50 分钟

时间多花一倍，质量直接上一个台阶。真要部署用的，选 9B 别犹豫。

二、客服数据集模板

数据质量是微调成败 70%。客服场景标准格式（JSONL，每行一条对话）：

{"messages": [ {"role": "system", "content": "你是 X 公司的客服助手，专业、友好、简洁。只回答与本公司产品、订单、售后相关的问题；其他问题礼貌引导用户咨询人工客服。"}, {"role": "user", "content": "你们退货多久能到账？"}, {"role": "assistant", "content": "您好，退货商品我们签收后 1-3 个工作日内会原路退款到您的支付账户，请耐心等待哦。如果超过 3 个工作日还没到账，可以联系人工客服为您查询。"}]}

关键点（直接决定模型质量）：

system prompt 一定要写公司人设：模型会把人设当"灵魂"学进去，后面无 prompt 也保持风格
回复长度要"统一长短"：训练 500 条全是一段话回复，模型就不会突然给你长篇大论。一致性 > 详尽
要覆盖拒答场景：放 50 条用户问无关问题、AI 礼貌引导的样本，否则模型啥都敢答
多轮对话要占 30%：现实客服很少一问一答，要训练上下文跟随
写 prompt 的人 ≠ 写 answer 的人：让客服主管或质检员写 answer 部分，prompt 由产品/运营写，能避免"自问自答风格雷同"

数据规模：

数据量	效果	适用
100 条以下	几乎学不会人设	不要做
300-500 条	风格学得到，但术语易错	demo 验证
1000-3000 条	推荐量，业务问题准确率 80%+	实际部署
5000 条以上	边际收益递减	非必要别加

我这次实测 1200 条，下面的指标都是基于这个量。

三、训练前准备

装 Unsloth（之前装过可跳过）：

pip install unsloth

数据预处理：把 JSONL 拆 90% 训练 / 10% 验证，先用 jq 简单分割：

shuf data.jsonl > shuffled.jsonlsplit -l 1080 shuffled.jsonl part_mv part_aa train.jsonlmv part_ab val.jsonl

下载模型：

from unsloth import FastLanguageModelmodel, tokenizer = FastLanguageModel.from_pretrained( model_name="unsloth/Qwen3.5-9B-Instruct-bnb-4bit", max_seq_length=4096, dtype=None, load_in_4bit=True,)

第一次下载 5.2GB，国内慢的话设HF_ENDPOINT=https://hf-mirror.com。

四、LoRA 配置 + 训练

model = FastLanguageModel.get_peft_model( model, r=32, # LoRA 秩，9B 推荐 32 target_modules=[ "q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj", ], lora_alpha=64, # 一般 2 倍 r lora_dropout=0, bias="none", use_gradient_checkpointing="unsloth", # 关键省显存 random_state=42,)from trl import SFTTrainerfrom transformers import TrainingArgumentstrainer = SFTTrainer( model=model, tokenizer=tokenizer, train_dataset=train_dataset, eval_dataset=val_dataset, max_seq_length=4096, dataset_text_field="text", args=TrainingArguments( per_device_train_batch_size=1, gradient_accumulation_steps=8, warmup_steps=20, num_train_epochs=3, learning_rate=2e-4, fp16=True, logging_steps=10, eval_steps=50, save_steps=100, output_dir="outputs", ),)trainer.train()

关键参数我用 1200 条客服数据实测过的甜区：

参数	我的值	备注
LoRA 秩 r	32	客服场景不需要更高
alpha	64	2 倍 r
学习率	2e-4	9B 比 4B 稍高
epochs	3	2 欠拟合，4 过拟合
batch × accum	1 × 8	等效 batch 8，4060 不爆
序列长度	4096	客服多轮够用

RTX 4060 实测：

显存峰值：7.6GB（4060 8GB 险胜）
训练时间：1 小时 50 分钟
训练 loss：从 1.84 降到 0.41
验证 loss：从 1.78 降到 0.52（轻微过拟合，可接受）

五、效果验证：训练前 vs 训练后

我用 50 条没在训练集出现的真实客服问题做测试，两个模型同一份 prompt：

测试维度	原始 qwen3.5:9b	微调后
是否首句问候	23%	96%
是否提"本公司"	14%	98%
回复长度 60-150 字	41%	89%
不知道时如实说	32% 乱编	87% 引导人工
业务术语正确	76%	95%

最直观差异：问"你们运费多少"，原始模型会编一个"通常 8-15 元"；微调后会答"我们包邮（满 99 元），未满 99 元收 6 元运费"——它学会了你的真实业务参数。

六、导出给 Ollama 用

Unsloth 一键导出 GGUF：

model.save_pretrained_gguf("kefu-model", tokenizer, quantization_method="q4_k_m")

跑完得到kefu-model.gguf（约 5.5GB）。给 Ollama 加载：

# ModelfileFROM ./kefu-model.ggufPARAMETER temperature 0.3PARAMETER num_ctx 4096SYSTEM "你是 X 公司的客服助手……" ``````plaintext ollama create kefu -f Modelfileollama run kefu

接进 Open WebUI / FastAPI / Continue 都和普通模型一样。

七、客服微调避坑清单

不要用 ChatGPT 生成训练数据再去训练：很多人偷懒让 GPT 写 1000 条客服对话直接训，结果训出来的模型有"AI 味"——它学的是 GPT 的语气而不是你公司的。真人写 + 真业务样本才有效。
数据脱敏要彻底：训练数据里的真实姓名、手机号、订单号统一替换成占位符（<name>、<phone>）。否则模型会"记住"个别用户信息，泄露风险高。
拒答边界要训死：必须放至少 100 条"用户问无关问题，AI 礼貌引导"的样本，否则模型对法律 / 医疗 / 投资类问题敢瞎答。
业务术语统一：客服话术中"运费"还是"邮费"必须二选一，不一致模型会"学得糊涂"。我之前混着写，模型输出也跟着混乱。
训练完别在原模型上继续训：以为"再训一遍效果更好"——错。LoRA 重复训会让权重漂得越来越远，从训练好的 checkpoint 做小数据继续训前，先备份基线版本。
生产环境必上灰度：哪怕你测试集 95% 通过，也要先让微调模型回 5% 流量、人工抽查 3-5 天再扩。我第一次部署翻车的就是没做灰度，第一天模型把促销活动日期答错了 17 单。

传统产品经理，正在成为下个被淘汰的“传统岗位”。

过去画原型、写 PRD、跟进度的“传统技能包”，在AI时代正迅速贬值。63% 的企业转型做 AI 产品！当下的问题不再是“要不要学 AI ”，而是“如何构建 AI 产品”。

前段时间还跟字节、腾讯的资深 AI 产品经理沟通，他们反馈：在大量招人，只要有 AI 相关的项目经验，基本都能拿到面试机会，而且领导很舍得给钱，涨薪 40-60% 很正常！

接下来的产品人，得卷AI能力了！

如今AI大火，行业极速发展的背后，懂AI 产品人才却严重稀缺。这不是要你转技术岗，而是要掌握构建 AI 产品的核心方法：

如何将你的领域知识，转化为 AI 产品的核心竞争力？
如何用 AI 技术实现你的产品需求？
如何设计真正懂用户的 AI 交互体验？
……

懂AI，就是产品经理的“救命稻草”！

风口之下，与其焦虑被行业淘汰

不如先人一步享受AI技术带来的红利！

我把AI产品经理的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

（不限年龄！不限岗位！没有代码基础也能学！）

🎁现在扫码，完课还送：

《AI产品面试题库》《AI大模型应用案例集》

掌握技术+实战，快速转型！

想成为一名卓越的AI大模型产品经理，需要从技术、到项目实战的全方位转型指南！

**1）**AI产品应用原理解析，产品经理也能听懂！

对于产品经理来说，如果你不懂技术，做不了业务和AI大模型技术衔接、定义不了数据需求，是没法完整的落地一个产品的！

本次课程，专门面向产品经理人群，解析当下最热门的AI产品应用的必备的「大模型」、「多模态」的实际应用和算法原理！解析AI产品应用技术，积累大模型能力！简单易懂，不需要会代码，小白也能掌握！

大模型微调：掌握主流大模型（如DeepSeek、Qwen等）的微调技术，针对特定场景优化模型性能。学习如何利用领域数据（如制造、医药、金融等）进行模型定制
AI Agent智能体搭建：学习如何设计和开发AI Agent，实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手产品（如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等）

2）超全行业案例解析！

课程详细讲解现阶段，大模型在各个行业和领域的应用现状！包括：零售与电商、教育、医疗、泛娱乐、法律等等10大行业！

详细讲解案例的思路、应用场景，以及背后的技术原理、核心技术！揭秘各个行业、场景的真实现状，和未来产品的发展与机遇！

可以说，讲解完一个案例，就能积累一个AI产品实践的经验！

课程中所涉及到的实战项目，都可以直接在自己的工作中使用，让自己的产品/项目有可借鉴的成功案例！

3）AI产品经理求职专项辅导

课程中会系统的帮助大家拆解字节、腾讯、百度等大厂AI PM岗位JD关键词，掌握AI PM高频面试题型与回答框架；展示 AI 相关能力的关键技巧：Prompt设计、模型评估、A/B测试、成本意识、与算法/工程协作经验；

To B类AI产品经理：突出“行业理解 + 技术落地 + 商业闭环”能力的简历结构设计，展示项目成果；从客户需求洞察到技术方案设计，展现端到产品思维；如何评估To B AI产品的可行性、客户付费意愿与实施成本
To C类AI产品经理：拆解头部公司岗位JD，将过往尽力转化为AI产品叙事逻辑；从行业趋势、产品设计题、案例分析&数据分析题、技术理解边界等全流程辅导面试；避免无效海投、锁定最适合的AI产品岗位；

本次课程，全程直播讲解，能直接对话大佬和专业助教，不懂就问，超详细的案例，小白也能轻松get！

完课后，还赠送《AI产品经理面试题库》、《AI大模型应用案例集》！不断更新中……

适合人群：

想转型AI产品经理、AI项目管理专家、AI产品解决方案等岗位
想进行AI产品创业的创业者
想成为制作AI产品的程序员
想利用AI解决企业问题的管理岗
想在AI方向寻找就业方向的毕业生
AI方向前景广阔、待遇好！

目前，很多产品人已经通过完整学习拿到大厂高薪offer，收入嗷嗷涨！

我把AI产品经理的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

企业官网建设流程全解析

一、为什么是 9B 而不是 4B

二、客服数据集模板

三、训练前准备

四、LoRA 配置 + 训练

五、效果验证：训练前 vs 训练后

六、导出给 Ollama 用

七、客服微调避坑清单

传统产品经理，正在成为下个被淘汰的“传统岗位”。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

一、为什么是 9B 而不是 4B

二、客服数据集模板

三、训练前准备

四、LoRA 配置 + 训练

五、效果验证：训练前 vs 训练后

六、导出给 Ollama 用

七、客服微调避坑清单

传统产品经理，正在成为下个被淘汰的“传统岗位”。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

热门文章

文章分类

标签云

相关文章

从DNS到NTP：盘点那些‘非用UDP不可’的应用层协议，以及背后的设计哲学

别再用3.3V直接供电了！实测ESP8266-01S稳定运行的最佳硬件连接方案

VCZ框架在机器人控制中的符号控制原理与应用

需要专业的网站建设服务？

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】