CDFとは

CDFは、確率変数 $X$ が特定の値 $x$ 以下になる確率を示す関数のことであり、確率分布の累積的な傾向を把握し、データの全体的な特性や統計的な性質を分析するための統計学およびデータサイエンスにおける基本的な関数のことです。

CDFの概要と確率分布における役割

CDF(Cumulative Distribution Function、累積分布関数)は、確率論および統計学において、確率変数の振る舞いを記述するために用いられる関数です。CDFは、確率変数 $X$ のとりうる値が、特定の値 $x$ よりも小さくなるか、または等しくなる確率を返す関数として定義されます。

これは、観測されたデータや理論上の確率分布が、ある閾値(しきい値)までの値をどの程度含んでいるか、つまり、確率を累積的に表現するものです。CDFは、離散確率変数(例:サイコロの目)と連続確率変数(例:身長、温度)のいずれにも適用できます。

主な目的は、確率変数の全体的な分布パターンを把握し、特定の区間に入る確率やパーセンタイル(百分位数)といった重要な統計量を計算するための基礎を提供することです。

CDFの定義と数学的性質

1. 数学的定義

確率変数 $X$ の累積分布関数 $F(x)$ は、以下のように定義されます。

F(x) = P(X \le x)

ここで、 $P(X \le x)$ は、確率変数 $X$ が $x$ 以下である確率を示します。

2. 離散確率変数の場合

離散確率変数 $X$(確率質量関数 $P(x)$ を持つ)のCDFは、特定の値 $x$ までの確率を全て足し合わせたもの(総和)として定義されます。

F(x) = \sum_{t \le x} P(t)

3. 連続確率変数の場合

連続確率変数 $X$(確率密度関数 $f(t)$ を持つ)のCDFは、確率密度関数を負の無限大から $x$ までの区間で積分したものとして定義されます。

F(x) = \int_{-\infty}^{x} f(t) dt

4. CDFの重要な性質

CDFは、確率を示す関数であるため、以下の基本的な性質を持ちます。

  • 単調非減少: $x_1 < x_2$ であれば、常に $F(x_1) \le F(x_2)$ となります。これは、確率が累積的に増加するためです。
  • 値の範囲: 確率の定義により、関数の値は $0$ から $1$ の間に収まります。

\lim_{x \to -\infty} F(x) = 0[LaTex]\lim_{x \to \infty} F(x) = 1[/LaTex]

CDFの応用と活用

1. 確率計算

CDFを用いることで、特定の範囲に入る確率を容易に計算できます。確率変数 $X$ が区間 $(a, b]$ に含まれる確率 $P(a < X \le b)$ は、CDFを用いて以下のように計算されます。

P(a < X \le b) = F(b) - F(a)

2. パーセンタイルの特定

CDFの逆関数は、パーセンタイル関数(または分位関数)として知られています。

  • 例えば、 $F(x) = 0.5$ となる $x$ の値は、データの中央値(Median)または50パーセンタイルを示します。これは、データの半分がその値以下であることを意味します。

3. 統計的検定

CDFは、コルモゴロフ-スミルノフ検定などの統計的検定において、標本データの経験的累積分布関数(ECDF)を理論上のCDFと比較し、標本データが特定の分布に従っているかどうかを判断する際にも重要な役割を果たします。ECDFは、実際の観測データに基づいて累積確率を計算したものです。

関連用語

データサイエンスワークベンチ | 今更聞けないIT用語集
機械学習 | 今更聞けないIT用語集
AIソリューション

お問い合わせ

システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。

APPSWINGBYの

ソリューション

APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。

システム開発

既存事業のDXによる新規開発、既存業務システムの引継ぎ・機能追加、表計算ソフトによる管理からの卒業等々、様々なWebシステムの開発を行っています。

iOS/Androidアプリ開発

既存事業のDXによるアプリの新規開発から既存アプリの改修・機能追加まで様々なアプリ開発における様々な課題・問題を解決しています。


リファクタリング

他のベンダーが開発したウェブサービスやアプリの不具合改修やソースコードの最適化、また、クラウド移行によってランニングコストが大幅にあがってしまったシステムのリアーキテクチャなどの行っています。