2019-03

機械学習

K-Means:Pythonでクラスタリング

K-means法 N個のデータをランダムにK個のクラスタに振り分ける。 それぞれのクラスタのセントロイド(重心) \(\mu_k\ (k=1,...K)\)を求める。 $$ q_{ik} = \be...
機械学習

数値データとカテゴリデータの前処理まとめ

数値データとカテゴリデータ 簡単に説明すると 数値データは、数値である。 カテゴリデータは、文字である。 数値データは、数値であるので計算できるが、計算量を減らすためなど、データの前処理が必要になる。 カテゴリデー...
機械学習

欠測データとは

欠測データとは 欠測データとは、無記入・誤回答・欠落などデータがないことを意味しています。 この欠測データを処理しない場合、統計的な計算処理が出来なくなります。 例えば、平均や標準偏差などです。 データが欠測している場合...
統計学

データの種類・分類

データの種類 質的データと量的データ 質的データ 定性的データ カテゴリ・属性 量的データ 定量的データ 測定値・数量 データと...
機械学習

数量化についてのメモ

fMRI Data Analysis

フリーなfMRIデータを入手する方法

自然言語処理

TF-IDFとは

自然言語処理

BoW(Bag-of-Words)とは

機械学習

アンサンブル学習とは

統計学

相関分析とデータの種類

相関分析 相関分析では、変数間の関連性の強さを調べる。 相関係数などの統計量を使って、変数間の関連性を分析する。 データの種類によって、扱う統計量が変わる。 量的データ×量的データ 量的データ×質的データ 質...
機械学習

Pandasでtsvファイルを読み書きする方法

タイトルとURLをコピーしました