カテゴリデータのPython前処理まとめ
随時更新予定
Label Encoding
from sklearn.preprocessing import LabelEncoder le = LabelEncoder() le.fit(train_X) le_train_X = le.transform(train_X) le_test_X = le.transform(test_X)
One-Hot エンコーディング
pandasを使います。
import pandas as pd oh_train_X = pd.get_dummies()
ダミー変数化
import pandas as pd oh_train_X = pd.get_dummies(drop_first=True)
One-Hotとダミー化とpandas