XGBoost 實踐指南

本教程是[學習機器學習]（https://www.kaggle.com/dansbecker/learn-machine-learning）系列的一部分。 在此步驟中，您將學習如何使用功能強大的xgboost庫構建和優化模型.

什麼是 XGBoost

XGBoost 是處理標準表格類數據的主要模型（例如Pandas DataFrames中存儲的數據類型，而不是像圖像和視頻這樣的數據類型）。 XGBoost模型在目前的許多Kaggle比賽中佔據主導地位。

為了達到峯值準確度，XGBoost模型需要比Random Forest等技術更多的知識和_model調整。在本教程之後，你將能夠

Follow XGBoost的完整建模工作流程
fine-tune XGBoost model以獲得最佳性能

XGBoost是Gradient Boosted Decision Trees(梯度提升決策樹) 演算法的實現（scikit-learn有另一個版本的演算法，但XGBoost有一些技術優勢。）什麼是Gradient Boosted Decision Trees？我們將通過一個圖表展示