决策树分类培训讲义(PPT 96页)
所属分类:决策管理
文件大小:2745 KB
下载要求:10 学币或VIP
点击下载决策树
使用决策树进行分类
如何从训练数据中学习决策树?
ID3算法
ID3决策树建立算法
信息熵(Entropy)
数据集的信息熵
例:计算对下列数据集分类所需的信息熵
使用熵衡量数据纯度
信息增益
确定第一次分裂的属性:按年龄划分
确定第一次分裂的属性:按收入划分
确定第一次分裂的属性:按学生划分
确定第一次分裂的属性:按信用划分
确定第一次分裂的属性
确定第二次分裂的属性
决策树的基本原理
C4.5算法对ID3的改进
十大数据挖掘算法
改进1:信息增益的问题
改进1:信息增益率
改进2:连续值属性与分裂点
改进3:缺失值的处理
改进3:C4.5中缺失值的处理-建树过程(学习过程)
改进3:C4.5中缺失值的处理-分类过程
改进4:学习过程中的过度拟合
改进4:欠拟合、合适拟合、过拟合
改进4:过度拟合
改进4:缺乏代表性样本所导致的过度拟合
改进4:决策树剪枝
改进4:预剪枝
改进4:后剪枝
从决策树导出产生式规则
CART算法
回归树(RegressionTree)
Leaves=BooleanRules(布尔规则)
Gini指标
处理离散值属性
回归树的生成
剪枝
最大树
恰当的树
用于回归
高伸缩性决策树算法
决策树应用
对数据的要求
..............................
精品资料网 m.cnshu.cn
Copyright © 2004- 粤ICP备10098620号-1
风险管理 应急预案 研发管理 运营管理 内部管理 商业模式 执行力 连锁经营 公司治理 工厂管理 创新管理 家族企业 效率管理 名企案例 企业理念 价值管理 特许经营 瓶颈管理 调查问卷 策划方案 领导力 团队建设 企业变革 企业文化 战略管理 竞争策略 管理知识 危机管理 成本管理 项目管理 发展战略 年度计划 决策管理 企业上市 供应商 组织设计 产品管理 采购管理 品牌管理 企业诊断 企业咨询 商务谈判 物流管理 运作管理 管理制度 行业报告 经营管理 企划方案 MBA 流程管理 目标管理 招标投标 商务礼仪 管理表格 管理技能 管理案例 管理工具 管理手册 职业经理人 商业计划书 董事与股东 可行性报告