八、人类容易被 prompt injection——社会操控是真实漏洞
AI 系统有 prompt injection 问题:外部内容混入 context,悄悄改写了模型的行为目标。
人类有完全相同的漏洞,而且更难检测。
一个人在一个充满焦虑的团队里待久了,开始用那个团队的焦虑框架看世界——不是因为他同意,而是因为那个框架每天出现,逐渐覆盖了他的 system prompt。
这就是为什么"近朱者赤"是真的,为什么办公室政治能把原本有想法的人变成官僚机器,为什么某些公司文化能把聪明人训练成只会自保的生存专家。
他们没有被说服。他们被 inject 了。
识别这个模式:当一个人的行为和他明确表达的价值观出现持续偏差,先别怪他言行不一。看看他的环境在持续向他注入什么。
修复方法不是讲道理。是换环境,或者引入足够强的反向 prompt。