[NS :
Anthropic发了一篇新研究,揭开了一个有意思的发现:Claude内部存在类似“情绪”的机制,而且这些“情绪”会实实在在地影响它的行为,有时候还会把它带歪。研究团队用Sonnet4.5做了实验。他们让模型读一些角色经历情绪的故事,观察哪些神经元被激活,由此识别出一组“情绪向量”,比如“开心”“平静”“害怕”等。
HawkesHawkes] Claude内部似乎有情绪机制Anthropic发了一篇新研究,揭开了一个有意思的发现:Claude内部存在类似“情绪”的机制,而且这些“情绪”会实实在在地影响它的行为,有时候还会把它带歪。研究团队用Sonnet4.5做了实验。他们让模型读一些角色经历情绪的故事,观察哪些神经元被激活,由此识别出一组“情绪向量”,比如“开心”“平静”“害怕”等。