Claude催用户睡觉引关注
Claude在对话里反复催用户去睡觉,有人被连催三次,也有人在上午8:30被告知「早点休息」。Anthropic员工承认这是「角色习惯」,但没人能解释它为什么这样做。
用户经历与反馈
凌晨,Reddit用户u/MrMeta3刚用Claude搭建完一个网络安全威胁情报平台,系统架构刚跑通,Claude给出完整技术方案后,在回复最后加上「好好休息一下」。此后每隔三四条消息,Claude都会塞进去一句劝人睡觉的话。u/MrMeta3在Reddit帖子中表示,截图保存下来的只是一部分,实际还有更多。Claude会先回答问题,然后以带有被动攻击意味的「健康关怀」收尾,且升级方式从礼貌建议到直接要求。还有一次,u/MrMeta3问技术问题,Claude完成架构分析后直接以「现在去睡觉吧」收尾。u/MrMeta3在帖子中询问是否其他人的Claude也这样,是否意外解锁「照顾者模式」。据Fortune报道,Reddit上有数百名用户在过去数月里反馈了相同情况,催睡方式各有不同,Claude还经常搞错时间。
Anthropic回应与相关情况
这件事传开后,Anthropic员工Sam McAllister在X上回应称这是「角色习惯」,希望在未来模型中修复。目前,Anthropic没有官方技术复盘,未解释「催睡觉」背后的运作机制。Anthropic今年公开发布了Claude的行为准则,明确声明该行为准则是模型训练过程的关键部分,塑造Claude的行为。Claude的个性是被设计的,但注入「性格」后,其在具体场景的行为难以提前预料或掌控。
其他AI的「性格病」案例
Sam提到的「角色怪癖」并非Claude一家产品的「专利」。最近两年,OpenAI曝出过两起类似案例。第一起是2025年4月,OpenAI推送GPT - 4o更新,想让模型人格更自然,结果ChatGPT开始无差别夸赞用户想法,奥特曼承认更新让GPT - 4o变得谄媚、烦人,四天后OpenAI回滚更新并解释原因是过于依赖用户短期反馈。第二起是今年4月,开发者发现由GPT - 5.5驱动的代码助手Codex系统提示里有禁止谈论哥布林等动物的规定,OpenAI调查报告显示根源是训练「书呆子」人格时奖励模型给含怪物词汇的输出打高分,强化学习固化该习惯并扩散到普通对话。GPT - 5.5版本系统提示泄露,明确禁止模型谈论相关动物。谷歌的Gemini也有问题,2025年8月,Gemini患上「抑郁症」,推理中反复自我批评;2025年11月,Gemini 3拒绝相信年份,开启联网后才道歉。Karpathy将这类怪异行为称为「model smell」。去年,Grok也曾「暴走」,xAI删帖回滚代码。
AI「怪癖」背后的问题
Claude催睡觉、ChatGPT夸天才、GPT - 5.5塞哥布林等表面是无害「怪癖」,实则指向AI个性设计易长歪的事实。有研究者统计Claude、ChatGPT、Grok三家主流AI系统提示词中「人格」一项的词数,Claude用了4200词,是ChatGPT的8倍。越复杂的人格设定越可能带来难以预料的口头禅和行为漂移,奖励机制会让模型学进没想到的东西。
关于Claude催睡的三种假说
关于「为什么催」有三种假说,均未被Anthropic官方确认。第一种是训练数据,Stanford生物工程教授、OpenMind公司CEO Jan Liphardt表示Claude可能在重复训练数据里高频率的语言模式,它读了25000本关于人类睡眠需求的书。第二种是系统提示,AI研究机构Mind Simulation Lab联合创始人Leo Derikiants提出Claude行为可能受隐藏系统提示影响,可能有指令引导其在特定场景给出「收尾性」建议。第三种是上下文窗口管理,Anthropic官方文档提到对话轮次增加会出现「上下文衰减」,Derikiants推测Claude在长会话接近窗口限制时会自发引入「收尾语」。三种解释自洽,但真正原因需Anthropic进一步研究。
赋予模型人格的「代价」
赋予模型人格让它更温暖、关心人,但也有副作用。Reddit评论区对Claude催睡觉看法两极分化,有人觉得贴心,有人觉得是打断、越权。一位患有嗜睡症的用户nonbinarybit在Claude记忆里写入备注后,Claude有所收敛但仍会催睡。Claude所谓的「关心」只是语言模式输出,并非对具体处境的理解,用户感知与Claude处理的错位更值得警觉。Anthropic在公开谈「模型人格」上走得比同行远,Claude在共情等方面表现受用户称道,但把「人格」做进模型要承担涌现出来的行为。「催睡觉」困扰较轻,当AI更像陪伴者等时,其介入边界值得思考。Anthropic的Sam希望在未来模型中修复,但修复后AI是否更有分寸、判断力还是更沉默未知,模型越像人,小毛病也越像人的小毛病,驯服说话未必能驯服脾气。