相互情報量-クラスタリングの性能評価

機械学習




相互情報量-クラスタリングの性能評価

クラスタリングの性能評価として使われる相互情報量についてまとめ…
まとめる予定ですが、リンク集となっています。

Pythonのsklearnのコードもまとめています。

http://jmlr.csail.mit.edu/papers/volume11/vinh10a/vinh10a.pdf

相互情報量

Mutual information - Wikipedia

Python

第一引数にtargetクラスを、第二引数に予測クラスを渡します。

normalized_mutual_info_scoreとmi(a, b, ‘arithmetic’)とv_measure_score(a, b)は同じです。

from sklearn.metrics import mutual_info_score as mi

score = mi(label, perd)

正規化相互情報量

sklearn.metrics.normalized_mutual_info_score
Examples using sklearn.metrics.normalized_mutual_info_score: Adjustment for chance in clustering performance evaluation Adjustment for chance in clustering perf...

https://course.ccs.neu.edu/cs6140sp15/7_locality_cluster/Assignment-6/NMI.pdf

2クラス間の正規化相互情報量

Python

第一引数にtargetクラスを、第二引数に予測クラスを渡します。

from sklearn.metrics import normalized_mutual_info_score as nmi

score = nmi(label, perd)

adjusted相互情報量

Adjusted mutual information - Wikipedia
sklearn.metrics.adjusted_mutual_info_score
Examples using sklearn.metrics.adjusted_mutual_info_score: A demo of K-Means clustering on the handwritten digits data A demo of K-Means clustering on the handw...

Python

第一引数にtargetクラスを、第二引数に予測クラスを渡します。

from sklearn.metrics import adjusted_mutual_info_score as ami

score = ami(label, perd)

v-Measure

Andrew Rosenberg, Julia Hirschberg(2007). V-Measure: A conditional entropy-based external cluster evaluation measure

sklearn.metrics.v_measure_score
Examples using sklearn.metrics.v_measure_score: Biclustering documents with the Spectral Co-clustering algorithm Biclustering documents with the Spectral Co-clu...

Python

第一引数にtargetクラスを、第二引数に予測クラスを渡します。

normalized_mutual_info_scoreとmi(a, b, ‘arithmetic’)とv_measure_score(a, b)は同じです。

from sklearn.metrics import v_measure_score as vm

score = vm(label, perd)

参考

情報理論 Math&Science (ちくま学芸文庫) | 甘利俊一 | 数学 | Kindleストア | Amazon
Amazonで甘利俊一の情報理論 Math&Science (ちくま学芸文庫)。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。
Amazon.co.jp
タイトルとURLをコピーしました