決定係数とは

決定係数(Coefficient of Determination)は、統計学や機械学習における回帰分析の評価指標の一つであり、R2(R-squared)と表記されます。

具体的には、実際の目的変数の値のばらつき(全変動)のうち、構築された回帰モデルによって予測された値の変動がどれくらいの割合を占めるかを示します。決定係数は0から1の間の値をとり、1に近いほどモデルの当てはまりが良い、つまり説明変数が目的変数の変動をより多く説明できていると解釈されます。

決定係数 の基本概念

回帰分析の目的は、一つまたは複数の説明変数を用いて目的変数の値を予測することです。決定係数は、この予測の精度、すなわち回帰モデルがデータにどれだけ適合しているかを評価するために用いられます。

決定係数は、全変動(Total Sum of Squares, SST)と残差変動(Residual Sum of Squares, SSR)を用いて計算されます。

  • 全変動(SST): 目的変数の実際の値とその平均値との差の二乗和であり、目的変数の全体のばらつきを示します。 SST=i=1∑n​(yi​−yˉ​)2 ここで、yi​ は i 番目の目的変数の実際の値、yˉ​ は目的変数の平均値、n はデータ点の数です。
  • 残差変動(SSRまたはSSE, Sum of Squared Errors): 目的変数の実際の値と回帰モデルによる予測値との差の二乗和であり、モデルによって説明できなかったばらつきを示します。 SSR=i=1∑n​(yi​−y^​i​)2 ここで、y^​i​ は i 番目の目的変数の予測値です。

決定係数 R2 は、これらの変動を用いて以下のように定義されます。

R2=1−SSTSSR​=SSTSST−SSR​=全変動(Total Sum of Squares)回帰変動(Explained Sum of Squares)​

分子の SST−SSR は回帰変動と呼ばれ、回帰モデルによって説明できた目的変数のばらつきを示します。したがって、決定係数は「モデルによって説明できた変動の割合」と解釈できます。

決定係数 の解釈

  • R2 が 1 に近い場合: 回帰モデルはデータによく適合しており、目的変数の変動の大部分を説明できていると解釈されます。予測値は実際の値に近い傾向があります。
  • R2 が 0 に近い場合: 回帰モデルはデータの変動をほとんど説明できておらず、目的変数の予測は平均値を用いるのと大差ない場合があります。
  • R2 が負の値をとる場合: これは通常、モデルがデータの平均値による予測よりも性能が低い場合に発生します。

一般的に、R2 の値が高いほど良いモデルとされますが、その解釈は分析の対象や分野によって異なります。例えば、物理学のような分野では非常に高い R2 値が期待される一方、社会科学のような分野では比較的低い R2 値でも意味のある洞察が得られることがあります。

決定係数 の注意点と限界

  • 説明変数の増加による R2 の上昇: 説明変数の数を増やすと、たとえそれらが目的変数と実際には関連していなくても、R2 の値は上昇する傾向があります。これは、過学習のリスクを示唆する可能性があります。この問題を補正するために、自由度調整済み決定係数(Adjusted R2)が用いられることがあります。
  • 因果関係を示唆しない: 決定係数は、説明変数と目的変数の間の関連性の強さを示すものであり、因果関係を示すものではありません。高い R2 値が得られたとしても、説明変数が目的変数の原因であるとは限りません。
  • 線形関係のみを評価: 決定係数は、回帰モデルが捉える線形な関係の適合度を評価するものであり、非線形な関係を捉えるモデルの性能を適切に評価できない場合があります。
  • 外れ値の影響: 決定係数は、データの外れ値の影響を受けやすい可能性があります。

決定係数は、回帰分析モデルの性能を評価する上で重要な指標の一つであり、モデルが目的変数の変動をどれだけ説明できるかを示します。値の解釈には注意が必要であり、自由度調整済み決定係数や他の評価指標と合わせて総合的に判断することが重要です。

関連用語

多項式回帰モデル | 今更聞けないIT用語集
回帰モデル(線形・非線形) | 今更聞けないIT用語集
AIソリューション

お問い合わせ

システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。

APPSWINGBYの

ソリューション

APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。

システム開発

既存事業のDXによる新規開発、既存業務システムの引継ぎ・機能追加、表計算ソフトによる管理からの卒業等々、様々なWebシステムの開発を行っています。

iOS/Androidアプリ開発

既存事業のDXによるアプリの新規開発から既存アプリの改修・機能追加まで様々なアプリ開発における様々な課題・問題を解決しています。


リファクタリング

他のベンダーが開発したウェブサービスやアプリの不具合改修やソースコードの最適化、また、クラウド移行によってランニングコストが大幅にあがってしまったシステムのリアーキテクチャなどの行っています。