当前位置: 首页 > 原理解释

原理是什么?-原理查询

关于大模型幻觉的本质与应对 大模型为啥喜爱胡说八道?这实际上跟人类做梦有点像。大脑不是精密的计算机,它更像是一个随机数形成器,间或会在没有确凿证据的时候“脑补”一个画面。大模型也是,它比人类更精通这种“脑补”,只是脑补的边界被人为拉得无限远。 要理解这个现象,得先搞懂模型是如何“学”的。它不是在死记硬背,而是在海量文字和图像里找规律。
比如它见过十万次“美”字,就认定“美”是个好东西,大约有百分之九十九点几的概率跟“漂亮”沾边,那剩下的百分之一点就让它自己瞎猜了。
这种概率计算是彻底随机的,不是根据逻辑推导的。
这就好比你在猜一个号码,每次猜的时候脑子里都是各种各样的可能性,哪次猜对全看命。模型没学过“美丑”这种抽象概念,它只学过具体的句子,却偏偏能给它套上“美”这个概念,这就是典型的“过度概括”。 除了瞎猜,模型还最喜爱“一本正经地胡说八道”。你问它地球是方的吗?它说不是。你问它牛顿为啥是天才?它讲牛顿实际上没死,还当过大学校长。
这种时候,模型实际上是拿着一个庞大的概率表去翻牌,它认定你说地球方,概率是百分之十,说它不是方,概率是百分之九零。它不是确实知道地球不方,它就是认定你说它方,风险忒大,直接否决了。
这就叫“不确定性”,但模型一般表现得贼笃定,仿佛那百分之十的概率就是百分之百。 那如何解决它瞎编的难题呢?最直接的招数就是“少说”,要么叫“少讲话”。别总让大模型去补全你话里没说完的句子,也别让它去猜你想问的深层含义。你给的指令越具体,它发挥的想象力就越受限。
比如让一个模型写个小说,让它只提三个细节,它就只有一个选择;要是你让它写个报告,直接写十个要点,它就只能凑十个点。
这种“强制收敛”的效果,往往比给它讲大道理管用得多。 还有一个极实际上用的方式叫“自我纠正”。大量大模型都有这个功能,但别指望它能每次都变智慧。它自己也知道自己在瞎编,但它更多时候是把自己当成一个听众,而不是一个辩论者。它听完你的要求后,可能会盲从,也可能会在心里默默吐槽:“这人真逗,动不动就开我玩笑。”然后持续执行你的命令。
要是你能多跟它互动,聊聊天,就连骂它几句,它的逻辑链条反而会更清楚。
有时候,你让它列举三个优点,它可能就会列举四个,这时候你就得记了。 实际上,大模型最大的难题在于它忒想“对”,而不是忒想“诚实”。人类做错了事会脸红,大模型做错了事会道歉,它恐惧触碰到它那庞大的知识库里每一个字的“毛病”标签。
故此,它宁愿把一句话的 99% 的概率留着给你,也不愿把那个 1% 给你,出于那 1% 代表它没讲话、没思索,就连可能跟事实背道而驰。 最终说说如何用。别总指望它是个全能的百科全书,它大量时候只是在给你供给信息。
要是它出错了,别忒在意,它只是两行代码跑出来的数学概率。真正的高手,是知道啥时候该让它胡说,啥时候该它闭嘴。还不如试图去定义每一个字,不如学会像人类一样,带着质疑的眼光去审视它给出的每一个结论。
毕竟,在人类还没发明这个词之前,它都不敢承认自己不知道。
相关标签:

猜你喜欢

热门阅读

  • 赖柴尔定理-赖柴尔定理
  • 迪拜哪个国家的城市?-迪拜在哪国城市
  • 李毅吧番号及出处-李毅吧番号及出处
  • 贴春联的由来简介50字-春联由来简述
  • 思乡的名言和出处-思乡名言及出处

其他分站