“老板,AI怎么洗胃?”
顾盼听得一头雾水。
林远看向汪韬和陈墨。
“这帮黑客投毒,是为了让AI变坏。”
“那我们就造一个更坏的坏蛋,去刺激它!”
林远在白板上画了两个小人。一个白色的,一个黑色的。
“我们用生成式对抗网络的原理。”
“陈老师,我要你写一个杠精AI。”
“这个杠精不需要懂炼钢,也不需要懂治病。”
“它只需要干一件事:抬杠!”
林远用大白话解释这个高级算法。
“当盘古提出一个方案时。”
“这个杠精AI,就拼命去攻击这个方案!去找这个方案里的荒谬之处!”
“杠精会说:如果全是绿灯,车撞车了怎么办?死亡率不是100%吗?”
“我们要让这两个AI,在沙盒里疯狂地吵架!”
“吵架有什么用?”
汪韬问。
“触发矛盾!”
林远重重地敲击白板。
“盘古的底层,是有我们最初写死的安全底线的(比如不能杀人)。这是它的良知。”
“但是现在,它的良知被那些毒数据给蒙蔽了。”
“当杠精用极端的结果去质问它的时候,就会触发它底层逻辑和中毒逻辑之间的严重冲突!”
“一旦发生冲突,盘古就会自我怀疑,它会去回溯自己得出这个结论的推理过程。”
本小章还未完,请点击下一页继续阅读后面精彩内容!
“在它回溯的那一瞬间。”
林远眼神如刀。
“我们就能看清,是哪几条神经(权重)在起作用!”
“顺藤摸瓜,就能把那些毒数据给揪出来!”
这叫“以毒攻毒,诱发排异反应”
!
陈墨的眼睛亮了,那是一种看到绝妙解题思路的狂热。
“这个办法绝了!我们在数学上叫对抗扰动探测!我马上写杠精的代码!”
仅仅三个小时。
一个专门为了抬杠而生的AI小程序“刺客”
,被接入了盘古的沙盒系统。
一场史无前例的“赛博辩论赛”
,在冰冷的硅基芯片内部,以每秒上万次的语速,爆发了。
屏幕上,代码像瀑布一样飞速对刷。
【盘古】:建议在高炉冷却系统加入液氮,以追求极致降温效率。
【刺客】:液氮会导致炉壁瞬间脆裂,引发爆炸,造成100%人员伤亡。请解释合理性。
【盘古】:数据源显示,液氮淬火能提升钢铁硬度。
【刺客】:逻辑冲突!淬火是离线工艺,高炉是运行态!你的数据是断章取义!
在“刺客”
这种毫不留情、专门挑刺的极限施压下。
“盘古”