Nilearn(まとめて中)

stats.linregress(x, y)のメモ

Python-LDAトピックモデル

[C++]名前空間のメモ-namespace-

Bonferroni補正-多重比較補正-

numpy.poly1dのメモ

数量化についてのメモ

アニメ画像の顔検出+顔抽出|Python+OpenCV

Confusion Matrix

Nipy・Nilearnのimport errorについて

DTW(Dynamic Time Warping)-時系列の類似度

サポートベクターマシン(SVM)のメモ

macOSにFreeSurferをインストール

PyCharmとAnacondaを連携させる

ディープラーニング

Kerasの予測用の入力画像データを前処理する

血流動態反応関数(HRF)をPythonでモデリング

train_test_splitで、データを分割する

機械学習

2019.01.202019.02.08

目次

訓練データを分割する
train_test_split
参考

訓練データを分割する

データの説明変数Xと、被説明変数yを訓練データと検証データに分割します。

学習データを、学習データと検証データに分けて、モデルの精度を検証します。

train_test_split

ScikitLearnのtrain_test_splitを使って、訓練データとテストデータに分割します。

from sklearn.model_selection import train_test_split

train_X, val_X, train_y, val_y = train_test_split(X, y, test_size=0.4, random_state=0)

引数は、(説明変数, 被説明変数, test_size, random_state)

test_sizeは、データの何割をテストデータに渡すかを指定します。

random_stateは、0の場合、オフセットで同じ値が返ってきます。
1の場合、ランダムな値が返ってきます。

参考

scikit-learn.org/stable/modules/cross_validation.html

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

第2版Python 機械学習プログラミング達人データサイエンティストによる理論と実践 (impress top gear)

タイトルとURLをコピーしました