ケンドールの順位相関係数とは

ケンドールの順位相関係数(Kendall’s rank correlation coefficient)は、2つの量的変数間の単調な関係性の強さを数値で表す統計指標です。スピアマンの順位相関係数と同様に、変数間の関係が線形であることを仮定しません。

ケンドールの順位相関係数の特徴

  • 順位データに基づく: 元のデータではなく、各変数の順位に基づいて相関係数を計算します。
  • 非線形な関係に対応: 変数間の関係が単調増加または単調減少であれば、線形に限らず相関を評価できます。
  • 外れ値に強い: 順位を用いるため、外れ値の影響を受けにくいです。
  • ノンパラメトリック: データの分布に関する仮定を必要としません。
  • 同順位への対応: 同順位がある場合でも、適切な計算方法を用いることで対応できます。

ケンドールの順位相関係数の計算方法

ケンドールの順位相関係数(τ)は、以下の手順で計算されます。

  1. 順位付け: 各変数について、データの順位を決定します。
  2. ペアの分類: 
  3. すべてのデータ点のペアについて、2つの変数の順位の大小関係が一致するかどうかを判定します。
    • 一致する場合:一致ペア(concordant pair)
    • 一致しない場合:不一致ペア(discordant pair)
  4. 相関係数の算出:
    • 以下の式を用いて、ケンドールの順位相関係数(τ)を算出します。
τ = (一致ペア数 - 不一致ペア数) / (n * (n - 1) / 2)

ここで、

  • n: データ点の数

ケンドールの順位相関係数の解釈

ケンドールの順位相関係数の値は、-1から+1までの範囲を取り、以下のように解釈されます。

  • +1: 完全に正の単調な関係があることを示します。一方の変数が増加すると、もう一方の変数も必ず増加する傾向があります。
  • 0: 単調な関係がないことを示します。2つの変数は互いに独立していると考えられます。
  • -1: 完全に負の単調な関係があることを示します。一方の変数が増加すると、もう一方の変数は必ず減少する傾向があります。
  • 0に近い値: 2つの変数にはほとんど単調な相関がないといえます。
  • ±0.2~0.4程度: 弱い単調な相関関係があるといえます。
  • ±0.4~0.7程度: 中程度の単調な相関関係があるといえます。
  • ±0.7以上: 強い単調な相関関係があるといえます。

ケンドールの順位相関係数の注意点

  • 単調な関係のみを評価: ケンドールの順位相関係数は、あくまで単調な関係のみを評価します。変数間の関係が複雑な場合、相関係数が低くても実際には強い関係がある可能性があります。
  • 因果関係を示すものではない: ケンドールの順位相関係数は、2つの変数間の関係の強さを示すものであり、因果関係を示すものではありません。相関関係があっても、一方が他方の原因であるとは限りません。
  • 同順位の処理: 同順位がある場合は、適切な処理が必要です。同順位の数が多いと、相関係数の値が小さくなる傾向があります。

ケンドールの順位相関係数は、2つの量的変数間の単調な関係性を評価するための有用な指標です。変数間の関係が非線形である場合や、外れ値の影響を受けやすい場合に適しています。

関連用語

スピアマンの順位相関係数 | 今更聞けないIT用語集
ピアソンの積率相関係数 | 今更聞けないIT用語集
AIソリューション

お問い合わせ

システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。

APPSWINGBYの

ソリューション

APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。

システム開発

既存事業のDXによる新規開発、既存業務システムの引継ぎ・機能追加、表計算ソフトによる管理からの卒業等々、様々なWebシステムの開発を行っています。

iOS/Androidアプリ開発

既存事業のDXによるアプリの新規開発から既存アプリの改修・機能追加まで様々なアプリ開発における様々な課題・問題を解決しています。


リファクタリング

他のベンダーが開発したウェブサービスやアプリの不具合改修やソースコードの最適化、また、クラウド移行によってランニングコストが大幅にあがってしまったシステムのリアーキテクチャなどの行っています。