相関係数いろいろ

正規分布ではないときはいわゆる相関係数[ピアソンの相関係数]を使うのは不適切.

でも,使われてしまっている相関係数[ピアソンの相関係数].

「ピアソンの積率相関係数[Pearson's product-moment correlation coefficient]正規分布が仮定できる場合に利用.スピアマンの順位相関係数[Spearman's rank correlation coefficient]正規分布が仮定出来ない場合に利用.ケンドールとどちらを使うかは特にこれといった基準は無い.ケンドールの順位相関係数[Kendall's rank correlation coefficient]は,正規分布が仮定出来ない場合に利用.スピアマンとどちらを使うかは特にこれといった基準は無い.」

NGS Surfer's Wiki 相関係数

一般的にただ相関係数と言った時はピアソンの相関係数のこと.

ピアソンの積率相関係数.

でも,この相関係数は正規分布とセット.

そして,ビジネスで使われるデータには得てして正規分布に従わないものが多かったりします.

「2つの量的変数の関係性を調べるためによく利用される統計量に相関係数があります.一般的によく利用される相関係数は,Pearson(ピアソン)の積率相関係数と呼ばれるものです.これは小文字rで表現され,-1≦r≦1の範囲を取ります.+(プラス)は正の相関であることを意味し,一方が増加することでもう一方も増加する正の関係性を表します.また,−(マイナス)の場合は負の相関であることを意味」

出典


Mathematics is the language with which God has written the universe.





















National Data Science Bowl - 相関係数いろいろ - DeepDB - 室内有害ガス検知 - 前史