数値データとカテゴリデータ
簡単に説明すると
- 数値データは、数値である。
- カテゴリデータは、文字である。
数値データは、数値であるので計算できるが、計算量を減らすためなど、データの前処理が必要になる。
カテゴリデータは、文字であるので、まず数値化(=エンコード)する必要がある。
数値データの前処理
数値データの前処理を下にまとめます。
- Min-Max-Scaler
- Standard Scaler
- \(l^2\)正規化
- 対数変換
- べき変換
- Robust Scaler
カテゴリデータの前処理
カテゴリデータの前処理を下にまとめます。
- 2値化
- One-Hotエンコーディング
- ダミー変数化
- 特徴量ハッシュ
- ビンカウンティング
参考
次元圧縮
主成分分析
ZCA
参考書