[SIGNATE]TITANIC-PyTorch×ニューラルネット

MRIcronのdcm2niiguiのインストール

コルモゴロフ-スミルノフ検定(KS検定)[正規性の検定]

Nilearn(まとめて中)

[C++]テンプレート関数の使い方

Python+OpenCV|SIFT特徴量

Visual StudioでOpenCVを使う方法

Python+OpenCV|１次微分フィルタ

Pythonで機械学習-LASSO-

アニメ画像の顔検出+顔抽出|Python+OpenCV

多重共線性を回避する：メモ書き

PyTorchのDataloader -samplerとclass_weightなども-

Python+OpenCV|2値画像処理

C++関数に２次元配列を渡す方法

相関分析とデータの種類

VIFを利用した減少法による変数選択法in Python

Scikit-learnでよく使う分類モデルまとめ

PyTorchのDataloader -samplerとclass_weightなども-

ディープラーニング

2020.07.05

目次

PyTorchのDataloader
参考

PyTorchのDataloader

torch.utils.data.DataLoader()

流れ

Datasetを用意する
DataLoaderにDatasetを渡す
DataLoaderからBatchごとのデータをもらって学習する

Datasetは下のようなもの

TensorDataset(X_train, y_train)

画像のDatasetの作り方は下のリンクから
PyTorchのdatasetsで画像データセットを作る

dataloader

torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None,
           batch_sampler=None, num_workers=0, collate_fn=None,
           pin_memory=False, drop_last=False, timeout=0,
           worker_init_fn=None)

指定するargumentsは、だいたい下の4つだと思います。
samplerはbatch内の重みを決めるためのものなので、使わない場合も多いです。

dataset: Datasetをを指定
batch_size: batchサイズを指定
shuffle: シャッフルするかどうか
sampler:　batchの中身の配分

sampler

datasetsのBatchを決めるための機能
samplerを渡すときは、shuffleがFalseだとエラーが出ます。

PytorchのDataloaderとSamplerの使い方 - Qiita

classのweightで

batch_size = 20
class_sample_count = [10, 1, 20, 3, 4] # dataset has 10 class-1 samples, 1 class-2 samples, etc.
weights = 1 / (torch.Tensor(class_sample_count)*1e-5)
weights = weights.double()
sampler = torch.utils.data.sampler.WeightedRandomSampler(weights, batch_size)
trainloader = torch.utils.data.DataLoader(trainDataset, batch_size = batch_size, sampler = sampler)

参考

タイトルとURLをコピーしました