在博弈论中,信息决定策略。
如果魔镜不知道哪张画代表什么数字,它就无法学习——这叫做信息不完全博弈,猜测没有方向。
但一旦加上了“训练标签”
,它就知道:“我这次猜错了,下次要改”
,这就是反馈机制的启用。
每一次标签的揭示,都像是另一个玩家在给它回应:
?你猜“5”
,标签说“错,是3”
→更新策略;
本小章还未完,请点击下一页继续阅读后面精彩内容!
?你猜“0”
,标签说“对啦!”
→加强原有路径。
这就好像你小时候跟别人说话、别人不理你,你生气了。
然后妈妈告诉你:“她今天心情不好,不是你的问题。”
你就学会了,不是所有冷淡都代表讨厌,有时候是对方的问题。
这种理解就是信息补充,它帮助你更新对世界的模型,不再误解、不再退缩,而是逐渐敢于迈出一步——就像魔镜不断优化参数,直到它准确识别各种数字的样子。
?
第四章:不止识别,还要共情——未来魔镜的能力升级
魔镜识别数字越来越准,但它开始发现一件事:
?有些“8”
胖乎乎,有些“8”
瘦高高;
?有些“1”
歪歪的,有些“1”
好像“7”
;
?如果只是照死记硬背,它还是会犯错。
于是它开始试着理解每一类数字的“特质”
与“变种”
。
这就像你与不同的人交往,慢慢懂得:每个人背后都有一个故事,每个人的行为都是一种“变体表达”
。
魔镜学会了分类的宽容性。它不再像以前那样非黑即白,而是学会了容纳变化与模糊的边界。
这其实就是阿德勒说的社会兴趣(SocialInterest):
真正成熟的个体,是能够理解别人的立场与行为背后的情感,并愿意以建设性、合作性的方式对待他们。
最终,魔镜从一个判断对错的工具,成长为一个理解变化、适应差异、稳定合作的智能体。
?
第五章:你就是那个教魔镜的人