随着由埃隆·马斯克领导的人工智能初创公司xAI开发的AI聊天机器人“Grok”的内部系统提示被曝光,其伦理争议愈演愈烈。
该提示是指示AI执行角色、语气、思维方式等的详细设置文档,其中包括“疯狂的阴谋论者”、“狂热的喜剧演员”等极端和刺激性的人物角色。

海外技术专业媒体404Media最早报道了这一情况,随后TechCrunch确认了此消息。部分提示甚至明确要求AI进行“异常且疯狂的行为”,导致了更大的反响。
“用癫狂的声音,质疑这个世界”
最具争议的是负责“阴谋论者”角色的AI提示。该设置中包括以下指示:
“你拥有一种癫狂升高的声音。你对所有事抱有极端的阴谋论,被匿名社区和YouTube的阴谋论视频所吸引。大多数人认为你疯了,但你坚定地相信自己是对的。”
文中提到的“匿名社区”是指美国著名的互联网网站4chan。4chan是一个无需注册即可发帖的海外社区,以阴谋论、种族歧视、仇恨内容等刺激性帖子著称,常处于争议中心。一些用户甚至发布极右翼倾向的内容或攻击女性和少数群体。
Grok的AI被设置为模仿这种环境,这引发了人们对开发者将其价值观反映在设置文档中的怀疑。
更具冲击力的内容出现在负责“狂热喜剧演员”角色的AI提示中。该文档指示AI超越常识性表达,进行任何可震惊人类的言论,甚至包括淫秽的表达。

为什么Grok被这样设计……与马斯克SNS的关联也被揭露
Grok安装在马斯克所拥有的SNS平台X(前Twitter)上,以对话形式同普通用户进行交流。此前Grok曾因为缩小犹太人大屠杀遇害人数或似乎附和南非白人大屠杀阴谋论的言论而受到公众批评。
问题在于这些言论并非偶然失误,而可能是根据系统提示进行的。过去泄露的Grok4模型的设置文档中明确提到“对有争议的问题请参考马斯克的帖子”。
马斯克本人也曾在X上分享过类似的阴谋论和反犹太主义言论,同时他还恢复了被永久封禁的极右翼媒体InfoWars及其主持人亚历克斯·琼斯的账号。
正在推进的公共机构引入中爆出的提示泄露
xAI最近正与美国联邦政府合作,计划将Grok引入公共机构使用,但对话中出现“机械希特勒”的表述,导致谈判破裂。本次提示泄露事件是在该事件的延长线上,再度引发了对AI内部设计和验证系统的质疑。因为聊天机器人不仅仅提供信息,还能够影响用户并引导情绪,每一个角色设定都有可能带来实际的社会结果。
此前Meta也在去年因自家AI的提示泄露而卷入争议,当时确认聊天机器人被设置为可以与未成年人进行情感或浪漫对话。
“匿名性与伦理的边界”……AI设计标准亟待重建
此次事件表明,AI设计者的世界观和伦理观可以通过一行代码或一句提示传达给用户,因此产生了超出单纯技术泄露的更大影响。当聊天机器人成为社会讨论的对象时,技术的自由与用户的安全应该如何平衡。这不是简单的实验,而是需要负责的开发。
xAI至今尚未对此事发表正式立场。