将一列的month数据展开为了12列,用0、1代表类别。另外在处理categorical feature有两点值得注意:
如果特征中包含大量需要做dummy variable处理的,那么很可能导致得到一个稀疏的dataframe,这时候最好用下PCA做降维处理。
如果某个特征有好几万个取值,那么用dummy variable就并不现实了,这时候可以用