機械学習

機械学習

ロジスティック回帰と勾配降下法

ロジスティック回帰と勾配降下法 勾配法を使って、ロジスティック回帰のパラメータを求めたいと思います。 計算式をメモしておきます。 計算式 シグモイド関数 $$ \sigma \left( z _ { i } \right...
機械学習

勾配降下法で重回帰分析してみた

勾配降下法で重回帰分析してみた Pythonで勾配降下法では、単回帰(回帰直線)で実験しました。 今回は、単回帰含め、重回帰分析まで広げてみます。 使うデータセットは、skleanのボストン住宅価格です。 モデルの説明 ...
機械学習

Pythonで勾配降下法

Pythonで勾配降下法 勾配降下法の更新 $$ \omega _ { i } = \omega _ { i } - \alpha \frac { \partial E } { \partial \omega _ { i } } ...
機械学習

Label Encoding|前処理シリーズ

Label Encodingとは 各カテゴリに、固有の数値を割り当てるエンコーディングをLabel Encodingといいます。 例えば、 上のようなカテゴリデータを数値化したい時、Label Encodingを実行すると...
機械学習

ランダムフォレスト

ランダムフォレスト 勉強中です。 ランダムフォレストsklearn
機械学習

決定木|Decision Tree Classifier pythonとsklearn

決定木|Decision Tree Classifier 勉強中です。 sklearn DecisionTreeClassifier
機械学習

ロジスティック回帰とはPythonとsklearn

ロジスティック回帰とは ロジスティック回帰は、分類問題で使われる。 ロジット関数とシグモイド関数 勉強し直します。 sklearnでロジスティック回帰 accuracy score 0.89というスコアになっ...
機械学習

EDA:探索的データ分析

機械学習

K-Means:Pythonでクラスタリング

Python+sklearn アヤメのデータセットを使います。 今回は、散布図を使って図示していきたいので、2変数しか使用しません。 "sepal length"と"sepal width"のみを使用します。 (PCAなどで次元...
機械学習

数値データとカテゴリデータの前処理まとめ

数値データとカテゴリデータ 簡単に説明すると 数値データは、数値である。 カテゴリデータは、文字である。 数値データは、数値であるので計算できるが、データの分布を見るのなど、データの前処理が必要になる。 カテゴリデ...
機械学習

欠測データとは

機械学習

数量化についてのメモ

機械学習

アンサンブル学習とは

機械学習

Pandasでtsvファイルを読み書きする方法

機械学習

データの正規化と予測精度|データの前処理

機械学習

データの正規化|データの前処理

機械学習

Scikit-learnでよく使う回帰モデルまとめ

機械学習

Kaggleの始め方-Titanicコンペに参加-

機械学習

scikit-learnでグリッドサーチ

機械学習

Scikit-learnでよく使う分類モデルまとめ

機械学習

pandasで欠損値まとめ

機械学習

Pandaでよく使うもの

Python

Seabornで相関行列の可視化|データの可視化

機械学習

train_test_splitで、データを分割する

機械学習

因子分析

因子分析とは 因子分析とは、様々なデータに影響を与えていると考えられる潜在的な要素を因子として取り出し、その構造を明らかにする分析手法です。 因子分析を使うと、変数の背後にある、共通した概念(共通因子)を抽出することができる...