Linear Regression
Polynomial Regression
对每一个 feature xi 都映射到 xi1,xi2,…xid,以及可能的交叉项。
Decision Tree (Random Forest) Regression
Random Forest: 视为 ensemble of 多个 linear functions
Impurity for continuous variables
I(t)=MSE(t)=Nt1⋅i∈Dt∑(y(i)−y^t)2其中 Nt 是节点 t 内的样本数量,Dt 代表这个节点对应的所有样本,y^t 代表预测样本值(其实是 sample mean),y(i) 表示样本真实值
y^t=Nt1i∈Dt∑y(i)使用随机森林时,在构建单棵决策树的时候,predicted target variable is calculated as the average prediction over all decision trees