当前位置: 首页 > 原理解释

决策树原理及构建流程-决策树原理与构建

咱把这根“决策树”掰开揉碎了讲,别整那些虚头巴脑的术语堆砌。好办说,就是给一个干巴巴的难题装个“抖机灵”。 这玩意儿到底咋用的?先看一个最丑的例子。
比如有人问:“我到底该不该辞职?”这难题本身就没法直接回答,出于“该不该”是个道德和利益交织的螺旋。
这时候咱得造个树。根节点就是“我”,底下分叉:往左走是“接纳工作”(概率 60%),往右走是“申请离职”(概率 40%)。 工作那边又分叉:薪资不错但累(80%)还是想家(20%)。离职那边分得更细:去干嘛?老家(方案 A)还是北上广(方案 B)?每个分支上头都要标记概率,这是树的核心灵魂。
要是概率标错了树就废了,就像盖房子地基打歪了,上面的装饰全得拆。 那这树是如何长出来的?别听那些书教“递归”要么“期望值”,咱就用最笨的办法。
第一步,别瞎猜。把你脑子里所有可能的答案都列出来,像背菜色一样,把“会死”、“能发财”、“可能没事”这些状态都摸清楚。
这时候要记住,树里的每个节点都能变成自己的小树,这叫子树。 第二步,给根节点设个概率。
这是最关键的一步,也是成本最高的一环。假设你有 100 个案子,你猜 80 个能赢,20 个输。
这 80% 和 20% 不是靠运气来的,是你对这类难题的掌控力。
比如做投资,你扔 10 万,定个 50 万回本率,树就成型了。 第三步,别急着画树枝。你得先选一个“主 Idea"。
比如问人意见,先问“只要不丢人”。
然后再问“只要不违法”。
这时候要注意数据的有效性。
要是问完这 100 个人,发现那个“不丢人”的结局里,有 90 个是傻逼开的玩笑,那这棵树还不如不写,直接砍了重写。 第四步,把每个分支的分支再切开,直到叶子节点(Leaf)出来。叶子节点一般有两种:一种是明确的“能”或“不能”,比如“绝对能赢”;另一种是不清楚的“可能”,比如“大约能赢”。
这时候就要引入概率了。
比如问“这题做对了吗”,回答可能是“对”(90%),也可能是“差点”(10%)。每一个“差点”的分支,都要标注出它的风险,比如“没把握但能够尝试”。 第五步,测测这棵树准不准。
这得靠数据。你拿历史数据去套。假设你上次问“要不要辞职”做了 100 次,每次回答“好”都拿了 5 万,每次回答“不好”都亏了 5 万。
那目前这棵树就活了。再问一次,要是回答“不好”拿了 3 万,那树得往回推,更新概率权重。
这叫贝叶斯,就是给树上的每个节点加个“修正系数”。 第六步,把树扔进计算器。
这步是决策树的一大特色,也是它区别于正常树的地方。别总靠人脑算,得让机器算。机器算完,给你个“最优解”,比如“别看去北上广有风险,但去老家稳一点”。
这时候,树就变成了一套算法,能帮你筛选掉那些“概率极低”要么“成本忒高”的分支。 这棵树长期如何用?比如做信贷审批。你先给模型发个图,图里记录了每个人的资产、负债、征信。模型把这棵树跑一遍,输出一个分数。分数高的,就推送他申请贷款;分数低的,直接拒之门外。
这就相当于把“决策树”变成了“风控模型”,把每个人的人生道路都锁死了。 再比如,当你问一个复杂的难题,比如“这个作者写得如何样”,没法直接回答。你得先问“他是哪位?”(根节点),再问“他写的是哪本书?”(子节点),再问“这本书的核心主题是啥?”(再细分节点)。最终的叶子节点可能是“主题深刻”要么“风格独特”。
这时候你再给作者打分。 那这棵树为啥能如此好用?出于它把不清楚的事件量化了。
那会儿问人,大家可能说“我认定凑合”,这没法量化。目前树把“凑合”拆成“内容好”、“文笔好”、“情感强”三个维度,每个维度都配了个数据点。
这就是为啥决策树如此神,能把人脑里那种乱七八糟的直觉,变成可计算、可优化的逻辑。 不过,这树也有毛病。
比如它忒依赖你给它的初始概率。
要是你一启动给的概率全对,那树准;但万一你给错了根节点的概率,那整棵树就是歪瓜裂枣。
这就是所谓的“烂柯棋”,开局就烂,后面如何努力都归零。
故此,构建之前得先测,测不准就别动。 最终,这棵树还能进化。
随着数据多了,原有的叶子节点可能不够,得把“可能”再加一阶,变成“比较可能”、“不忒可能”。
要么把某个分支再拆分,比如“别看写得一般,但情感挺真挚”。
这时候得看你的业务目标。是追求“最可能的结局”,还是追求“最保险的结局”?这拍板了树的走向。 总而言之,决策树就是个“概率计算器”,用来给不确定的人生、做事、投资打分。别指望它完美,但它是目前最靠谱的工具,能把 jargon 这种词儿,变成大家听得懂、能用的逻辑。
相关标签:

猜你喜欢

热门阅读

  • 赖柴尔定理-赖柴尔定理
  • 迪拜哪个国家的城市?-迪拜在哪国城市
  • 李毅吧番号及出处-李毅吧番号及出处
  • 贴春联的由来简介50字-春联由来简述
  • 思乡的名言和出处-思乡名言及出处

其他分站