Bagging算法

机器学习数据挖掘
范式
问题
  • 因素分析
  • CCA
  • ICA
  • LDA
  • NMF英语Non-negative matrix factorization
  • PCA
  • PGD英语Proper generalized decomposition
  • t-SNE英语t-distributed stochastic neighbor embedding
  • SDL
结构预测英语Structured prediction
  • RANSAC
  • k-NN
  • 局部异常因子英语Local outlier factor
  • 孤立森林英语Isolation forest
与人类学习
  • 主动学习英语Active learning (machine learning)
  • 众包
  • Human-in-the-loop英语Human-in-the-loop
模型诊断
  • 学习曲线英语Learning curve (machine learning)
数学基础
  • 内核机器英语Kernel machines
  • 偏差–方差困境英语Bias–variance tradeoff
  • 计算学习理论英语Computational learning theory
  • 经验风险最小化
  • 奥卡姆学习英语Occam learning
  • PAC学习英语Probably approximately correct learning
  • 统计学习
  • VC理论
大会与出版物
  • NeurIPS
  • ICML英语International Conference on Machine Learning
  • ICLR
  • ML英语Machine Learning (journal)
  • JMLR英语Journal of Machine Learning Research
相关条目
  • 人工智能术语英语Glossary of artificial intelligence
  • 机器学习研究数据集列表英语List of datasets for machine-learning research
  • 机器学习概要英语Outline of machine learning

Bagging算法 (英語:Bootstrap aggregating,引導聚集算法),又稱裝袋算法,是機器學習領域的一種集成學習算法。最初由Leo Breiman於1994年提出。Bagging算法可與其他分類回歸算法結合,提高其準確率、穩定性的同時,透過降低結果的變異數,避免過擬合的發生。

算法步骤

给定一个大小为 n {\displaystyle n} 训练集 D {\displaystyle D} ,Bagging算法从中均匀、有放回地(即使用自助抽样法)选出 m {\displaystyle m} 个大小为 n {\displaystyle n'} 子集 D i {\displaystyle D_{i}} ,作为新的训练集。在这 m {\displaystyle m} 个训练集上使用分类、回归等算法,则可得到 m {\displaystyle m} 个模型,在透過取平均值、取多数票等方法,即可得到Bagging的结果。

参考文献

  • Breiman, Leo. Bagging predictors (PDF). Technical Report No. 421. 1994 [2020-01-11]. (原始内容存档 (PDF)于2019-07-18). 
  • Breiman, Leo. Bagging predictors. Machine Learning. 1996, 24 (2): 123–140. doi:10.1007/BF00058655. CiteSeerX: 10.1.1.32.9399可免费查阅. 
  • Alfaro, E., Gámez, M. and García, N. adabag: An R package for classification with AdaBoost.M1, AdaBoost-SAMME and Bagging. 2012 [2016-10-02]. (原始内容存档于2019-09-24).