集成学习方法
集成学习通过建立几个模型组合来解决单一预测问题。工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合组合预测,因此优于任何一个单分类的预测
随机森林
随机森林就是集成学习方法的一种
随机
森林:包含多个决策树
原理过程
训练集:N个样本
特征值:M个特征
目标值
随机
- 两个随机
- 训练集随机 - N个样本中随机有放回抽样N个
- bootstrap 随机有放回抽样
- 新的树训练集
- 特征随机 - 从M个特征中随机抽取m个特征(M > m)降维
- 训练集随机 - N个样本中随机有放回抽样N个
API
总结
- 有非常好的准确率
- 能够有效的运行在大数据集上,处理具有高维特征的输入样本,而且不需要降维
- 能够评估各个特征在分类问题上的重要性
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 WangZun233!