カテゴリデータのPython前処理まとめ

データサイエンス




カテゴリデータのPython前処理まとめ

随時更新予定

Label Encoding

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()
le.fit(train_X)

le_train_X = le.transform(train_X)
le_test_X = le.transform(test_X)

One-Hot エンコーディング

pandasを使います。

import pandas as pd

oh_train_X = pd.get_dummies()

ダミー変数化

import pandas as pd

oh_train_X = pd.get_dummies(drop_first=True)

One-Hotとダミー化とpandas

one-hotのスライド
dummies

pandas_one-hot_dummies

タイトルとURLをコピーしました