台湾 || 语言: 大陆简体港澳繁體台灣正體

机器学习中的ensemble：Bagging与Boosting

雪花台湾 2019-04-07 21:26

集成思想是机器学习中重要的思想之一，kaggle中常用的的xgboost就是集成的应用。其基本框架是：假如你有一打分类器（我们称之为基分类器），假设这些分类器有不同的属性，将这些基分类器结合起来, 会有意想不到的效果，这篇文章记录的事集成思想的两种重要表现：Bagging与Boosting。本文是李宏毅老师ML Lecture22: Ensemble的笔记，建议大家去观看原视频。

Bagging

假设现在有N笔数据，每次从这N笔数据中sample出N个样本，就是通过这样的方式可以sample出多个database，接下来用一个复杂的模型对每个resample的database做训练，就得到了几个不同的function。接下来在做预测的时候，把数据分别丢进这些模型，然后对结果做平均（对回归问题）或者投票（对分类问题），这就是bagging的思想。

图片来自李宏毅老师ensemble课程

f_1(x) — 图片来自李宏毅老师ensemble课程

相关文章