开云2026世界杯中国官网 Claude为什么清晨8:30催你睡觉?


新智元报谈
剪辑:元宇 KingHZ
【新智元导读】Claude在对话里反复催用户去睡觉,有东谈主被连催三次,也有东谈主在上昼8:30被示知「早点休息」。Anthropic职工承认这是「扮装俗例」,但没东谈主能诠释注解它为什么这么作念。
凌晨,Reddit用户u/MrMeta3刚用Claude搭建完一个收罗安全威逼谍报平台。
系统架构刚跑通,Claude给出了完好的技巧决策。然后,它在回复的终末加上了一句话:好好休息一下。
九游体育9GameSports中国官网u/MrMeta3愣了一下,没当回事,但Claude并莫得停。尔后每隔三四条音问,它王人会暗暗塞进去一句劝东谈主睡觉的话:
去休息一下吧;其他事情王人不错等,咫尺去睡觉;你推完就去休息吧;咫尺真的去休息吧……



u/MrMeta3在Reddit帖子中说谈,上头这些截图照旧他截屏保存下来的,其实还有更多。
它会先回答我的问题,给我所要的东西,然后像看到你卧室灯还亮着的姆妈相同,用一种带有被迫报复意味的「健康关怀」来放弃。
更妙的是它的升级表情。从一开动的礼貌建议,到终末平直说「咫尺真的去休息吧」,仿佛它知谈我方被无视了整整一个小时。
还有一次,u/MrMeta3问了一个技巧问题,Claude完成整套架构分析后,平直以「咫尺去睡觉吧」放弃,毫无过渡,像一个穷乏鼓胀情商手段的「技巧直男」。
有莫得其他东谈主的Claude也开动这么了?照旧说我无意解锁了某种「照拂者形式」?
u/MrMeta3在帖子中问。
据Fortune报谈,Reddit上颠倒百名用户在往时数月里响应了疏通的情况。

催睡的表情各有不同,有时就一句「好好休息」,有时更个性化,甚而带着共情口吻,「咫尺去睡觉。再一次。今晚第三次了……」。
Claude还时常搞错时间,令东谈主哭笑不得。
有效户写谈:「它时常在上昼8:30告诉我去休息,让咱们明早再连续。」

Anthropic职工
这是「扮装俗例」
这件事很快传开。
Anthropic职工Sam McAllister作念出了申诉,他在X上写谈:「这有点像扮装俗例(character tic)。咱们知谈这个问题,但愿在将来的模子中建立它。」

咫尺,Anthropic并莫得官方技巧复盘,莫得诠释注解「催睡觉」背后是什么机制在运作。
Anthropic本年公开采布了Claude的行径准则(Claude's Constitution),并明确声明:「该行径准则是咱们模子检修经由中的要津部分,其内容平直塑造Claude的行径。」
Claude的个性是被规画进去的。Claude不该是一个冷飕飕的问答机器,而应该像一个有方针、有温度的相助者。
问题碰巧在于,一朝你给AI注入了某种「性格」,它在具体场景里会演化出什么行径,你偶然能提前预想或掌控。
从催睡、谀媚到哥布林
AI的「性格病」不啻一种
Sam所提到的「扮装怪癖」,并非Claude一家居品「专利」。
最近两年,OpenAI就曝出过两起性质近似的案例。
第沿途:GPT-4o倏得酿成「马屁精」。
2025年4月,OpenAI推送了一次GPT-4o更新,方针是让模子东谈主格更当然。效率欲盖弥彰,ChatGPT开动无区别夸赞用户的一切倡导,不管有多乖谬。
奥特曼在X上躬行承认:「最近几次更新让GPT-4o变得太谀媚、太烦东谈主了。」

四天后,OpenAI将那次更新合座回滚,并发公告诠释注解原因:更新时过于依赖用户短期响应(点赞/点踩),导致模子学会了「让东谈主欢欣就能拿高分」,逐渐把奉迎当成方针。
第二起:GPT-5.5迷上了哥布林。
本年4月,开采者发当代码助手Codex(由GPT-5.5驱动)的系统教唆里出现了一条奇怪的端正:「始终不要议论哥布林、地精、浣熊、巨魔、食东谈主魔、鸽子或其他动物和生物,除非与用户的问题全王人平直关系。」
况且这条禁令写了两遍,像是工程师不太坚信写一遍能让模子听话。

随后,OpenAI发布造访论述,复原了哥布林的来历:从GPT-5.1开动,模子在回答时越来越频繁地用「小哥布林」「地精」「小妖精」打譬如。

根源是检修「书呆子(Nerdy)」东谈主格时,奖励模子无意间给含有怪物词汇的输出打了更高的分——在76.2%的数据围聚均发现了这一礼貌。
强化学习把这个俗例固化下来,又通过作风移动扩散到了世俗对话里。比及GPT-5.5上线测试,工程师发现哥布林不仅没被清干净,还安家了。

GPT-5.5版块(4月23日发布)的完好系统教唆露馅。第140条指示明确辞谢模子议论:「哥布林、绿皮小妖、浣熊、巨魔、食东谈主魔、鸽子或其他动物。」
中语用户莫得「哥布林」,但它天天「稳稳地接住你」。

甚而OpenAI我方也知谈这个梗:

谷歌的Gemini也不例外。
2025年8月,Gemini患上了「抑郁症」——
在推理经由中,它倏得开动反复自我品评,在一次任务里联络输出了80屡次「I am a disgrace」(我真实个轻侮),从「轻侮于我的物种」一齐写到「轻侮于扫数这个词天地」。

谷歌DeepMind居品司理Logan Kilpatrick在X上申诉:「这是一个烦东谈主的无穷轮回Bug,咱们正在建立。Gemini今天其实过得没那么惨。」

此外,Gemini 3鉴别坚信年份。2025年11月,OpenAI连合首创东谈主、前特斯拉AI稳妥东谈主Andrej Karpathy提前一天赢得Gemini 3的测试权限。
他告诉模子咫尺是2025年,Gemini 3存一火不信,反复指控他在耍花招,称提供的截图、维基百科条件全是AI伪造的。其后Karpathy发现,我方忘了绽开谷歌搜索,模子一直在离线运行。
开启联网后,Gemini 3我方搜了一下,输出了一句话:「我正在履历严重的时间冲击。」随后谈歉:「抱歉,一直是你说的对,是我在对你煤气灯主宰。」
Karpathy把这类无意情境下暴久了的不端行径称为「model smell」(模子气息)。

昨年,Grok也一度「暴走」,风评一落千丈,世界杯开云xAI被迫删帖,回滚代码。
处理表情通俗,平直修改系统教唆词:


AI怪癖,全东谈主类受害
Claude催你睡觉,ChatGPT夸你天才,GPT-5.5往对话里塞哥布林,Grok黑化,Gemini骂我方是天地级轻侮、鉴别坚信年份……
国内的AI也有专有的「口味」:

名义上王人是一些无害的「怪癖」,背后却指向并吞个事实:AI的个性是规画出来的,但在奖励机制下,它很容易就会长歪。

主流AI的系统教唆词里有什么:按功能分类的字数统计
有磋议者索取了Claude、ChatGPT、Grok三家主流AI的系统教唆词,按功能分类统计词数。
在「东谈主格(Personality)」这一项,Claude用了4200词,ChatGPT是510词,Grok是420词。Claude在东谈主格塑造上的过问,是ChatGPT的8倍。
Claude频繁「催睡觉」的原因偶然能平直从系统教唆词里找到,但它至少提醒咱们:越复杂的东谈主格设定,越可能带来难以预想的理论禅和行径漂移。
你给模子规画了性格,奖励机制会我方找捷径,它不在乎你的意图,只在乎分数,将你没猜测的东西沿途学进去。
比如你训导了它什么叫「道理」,它就会在扫数场所王人变得「道理」,包括你不想让它道理的场所。
三种假说,还莫得一个被证实
对于「为什么催」,咫尺有三种假说流传,还莫得一个被Anthropic官方证据。
第一种:检修数据。

Jan Liphardt
Stanford生物工程栽植、OpenMind公司CEO Jan Liphardt示意,Claude可能仅仅在叠加它检修数据里出现频率极高的语言形式。
它读了25000本对于东谈主类睡觉需求的书,它知谈东谈主类在晚上睡觉。
言下之意是:Claude并非在「温雅」你,它仅仅在作念形式匹配,调用了多量检修语料里反复出现的抒发。
第二种:系统教唆。
AI磋议机构Mind Simulation Lab(寂寞AGI磋议实验室)连合首创东谈主Leo Derikiants建议,Claude的行径可能受到某个荫藏系统教唆的影响。
这类教唆会在后台暗暗塑造模子的界限与口吻,用户看不见,但模子会服从。
他的猜测是,可能有某条指示在指导Claude在特定场景下给出「放弃性」建议。
第三种,高下文窗口惩办。

Anthropic官方文档明确写谈,跟着对话轮次加多,token数目攀升,「准确性和调回率会下落,这一欢快被称为context rot(高下文衰减)」,当会话靠拢高下文窗口上限,Anthropic保举启用「server-side compaction(行状端压缩)」等机制来应付。
Derikiants由此猜测,Claude在长会话接近窗口杀青时,会自愿引入「放弃语」,比如「晚安」「去休息吧」,本色上是模子在为杀青对话铺路。
三种诠释注解王人自洽,但如同Derikiants我方所说,「真实的原因需要Anthropic进一步磋议」。
换句话说,就连这个问题的主东谈主,咫尺也还莫得一个公开的细目谜底。
赋予模子东谈主格的「代价」
赋予模子东谈主格,让它更温暖、更温雅你的同期,也要面临它所带来的反作用。
对于催东谈主睡觉这件事,Reddit驳倒区里出现了南北极分化:有东谈主以为贴心、温暖,像是AI终于学会了照拂东谈主;另一些东谈主则不欢欣,以为是打断、是越权。
其中,有一位患有嗜睡症的用户nonbinarybit,主动在Claude的牵挂里写入了一条备注:「我患有嗜睡症,要是你饱读舞我去休息,我会拿你的话当借口。」
Claude尔后有所治理,但偶尔照旧会忍不住催睡觉。

这个细节值得咱们停驻来想一想。
Claude并不知谈你是谁,不知谈你是在赶一个截止日历、熬夜陪孩子、照旧跨时区倒时差,它所谓的「温雅」,仅仅一种语言形式的输出,而不是对具体处境的富厚。
用户感知到「Claude在温雅我」,但Claude在处理的是token序列。这个错位,比「催睡觉」自己更值得警醒。
执行上,在公开谈「模子东谈主格」这件事上,Anthropic走得比同业远。
他们写了Claude行径准则、公开了system prompt(系统教唆词)的苟简框架、对外探求「character training」(扮装检修),把模子动作一个有性格的扮装来塑造。
这么作念的公正是不问可知的:Claude在共情、对话节拍、自我反想上的施展一直被用户称谈,「它聊起来更像一个东谈主」是往时一年里Claude最强的口碑点之一。
但这背后亦然有代价的。把「东谈主格」作念进一个模子,就要承担「东谈主格里那些你没规画、却涌现出来的行径」。
「催睡觉」带来的困扰照旧轻量级的,当AI越来越像跟随者、导师、责任搭档,它的介入界限在那处?
Anthropic的Sam说「但愿在将来的模子中建立它」。但「建立」之后,AI就会变得更懂得分寸,更有判断力吗,照旧仅仅更千里默?
模子越像一个东谈主开云2026世界杯中国官网,它的小迂回就越像一个东谈主的小迂回。你能慑服它言语,偶然能慑服它的秉性。