PytorchでCNN-Fashion-MNIST編

LoGフィルタ

Pytorch入門-線形回帰モデル

相関分析とデータの種類

ロジスティック回帰とはPythonとsklearn

Python NLTKを使った英単語の語幹抽出

[C++]名前空間のメモ-namespace-

時系列の自己共分散

シグモイド関数は、ロジット関数の逆関数

Niwidgetsのメモ

Bonferroni補正-多重比較補正-

ジャック・ベラ検定[正規性の検定]

ディープラーニング

KerasでGPUを使わない方法

Pythonのファイル&フォルダ操作まとめ

勾配降下法で重回帰分析してみた

PytorchのDatasetsで画像データセットを作る

Visual StudioでOpenCVを使う方法

train_test_splitで、データを分割する

機械学習

2019.01.202019.02.08

目次

訓練データを分割する
train_test_split
参考

訓練データを分割する

データの説明変数Xと、被説明変数yを訓練データと検証データに分割します。

学習データを、学習データと検証データに分けて、モデルの精度を検証します。

train_test_split

ScikitLearnのtrain_test_splitを使って、訓練データとテストデータに分割します。

from sklearn.model_selection import train_test_split

train_X, val_X, train_y, val_y = train_test_split(X, y, test_size=0.4, random_state=0)

引数は、(説明変数, 被説明変数, test_size, random_state)

test_sizeは、データの何割をテストデータに渡すかを指定します。

random_stateは、0の場合、オフセットで同じ値が返ってきます。
1の場合、ランダムな値が返ってきます。

参考

scikit-learn.org/stable/modules/cross_validation.html

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

第2版Python 機械学習プログラミング達人データサイエンティストによる理論と実践 (impress top gear)

タイトルとURLをコピーしました