Borderline-SMOTEとは
Borderline-SMOTEは、機械学習における不均衡データセット(Imbalanced Dataset)のクラス不均衡問題を解消するために考案されたオーバーサンプリング手法の一つであり、特に識別境界(Decision Boundary)付近に存在する、誤分類されやすい少数クラスのサンプルに焦点を当てて合成データ(Synthetic Data)を生成するためのアルゴリズムのことです。
Borderline-SMOTEの概要と不均衡データ問題
不均衡データセットとは、訓練データにおいて、ある特定のクラス(少数クラス)のサンプル数が他のクラス(多数クラス)に比べて極端に少ない状態を指します。このようなデータでモデルを訓練すると、モデルは多数クラスの分類精度を優先し、少数クラスを無視したり、誤分類したりする(少数クラスの予測精度が極端に低くなる)傾向があり、汎化性能が低下します。
SMOTE(Synthetic Minority Over-sampling Technique)は、少数クラスのサンプルとその近傍のサンプルとを線形に補間することで、新しい合成サンプルを生成する代表的なオーバーサンプリング手法です。
しかし、標準的なSMOTEは、全ての少数クラスのサンプルを等しく扱ってしまうため、少数クラスと多数クラスの領域が重なり合う識別境界付近の重要なサンプル(誤分類されやすい境界線上のサンプル)と、識別境界から離れた領域にあるノイズや外れ値に近いサンプルとを区別せずに合成データを作成してしまいます。
Borderline-SMOTEは、この課題を解決するために開発されました。この手法は、識別境界に存在する少数クラスのサンプル、すなわち学習において最も重要な情報を持つサンプルに重点を置いて合成サンプルを生成します。
主な目的は、識別境界付近のデータ密度を人為的に高めることで、モデルが少数クラスの境界線をより正確に学習できるようにし、不均衡データに対する分類性能を大幅に改善することです。
Borderline-SMOTEの動作原理
Borderline-SMOTEは、標準的なSMOTEの手順を拡張し、以下のステップで合成サンプルを生成します。
1. 識別境界上のサンプルの特定
まず、全ての少数クラスのサンプル $p$ に対して、データセット全体から最近傍点 $k$ 個を探索します。この $k$ 個の近傍点のうち、多数クラスのサンプルであるものの個数 $m$を数えます。
Borderline-SMOTEは、この $m$ の値に基づいて、少数クラスのサンプルを以下の3つのグループに分類します。
- 安全なサンプル(Safe): $m$ が非常に小さい(例:$m=0$)場合。周囲がほぼ少数クラスのみで囲まれており、分類が容易であると判断されます。
- ノイズ(Noise): $m$ が非常に大きい(例:$m=k$)場合。周囲が全て多数クラスに囲まれており、外れ値やノイズである可能性が高いと判断されます。
- 境界線上のサンプル(Borderline): $m$ が $0$ より大きく $k$ よりも小さい場合。このサンプルは少数クラスと多数クラスの境界線付近に位置しており、誤分類のリスクが高いと判断され、最も重要なサンプルとして識別されます。
2. 合成サンプルの生成
Borderline-SMOTEは、上記で識別された境界線上のサンプル(Borderline Samples)のみを対象として、SMOTEの合成手順を適用します。
- 合成: 境界線上のサンプル $p$ を起点とし、その近傍にある少数クラスのサンプルを選択し、その間の線分上に新しい合成サンプルを生成します。
- 焦点の絞り込み: 合成プロセスを最も識別が困難な領域に集中させることで、人工的なノイズの生成を防ぎつつ、識別境界の学習を強力に支援します。
3. バリエーション
Borderline-SMOTEには、近傍として少数クラスのサンプルのみを使用して合成するBorderline-SMOTE1と、多数クラスのサンプルも使用することで境界線近くの多数クラスを排除しやすくするBorderline-SMOTE2などのバリエーションが存在します。
関連用語
お問い合わせ
システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。
APPSWINGBYの
ソリューション
APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。
システム開発
既存事業のDXによる新規開発、既存業務システムの引継ぎ・機能追加、表計算ソフトによる管理からの卒業等々、様々なWebシステムの開発を行っています。
iOS/Androidアプリ開発
既存事業のDXによるアプリの新規開発から既存アプリの改修・機能追加まで様々なアプリ開発における様々な課題・問題を解決しています。
リファクタリング
他のベンダーが開発したウェブサービスやアプリの不具合改修やソースコードの最適化、また、クラウド移行によってランニングコストが大幅にあがってしまったシステムのリアーキテクチャなどの行っています。

ご相談・お問い合わせはこちら
APPSWINGBYのミッションは、アプリでビジネスを加速し、
お客様とともにビジネスの成功と未来を形作ること。
私達は、ITテクノロジーを活用し、様々なサービスを提供することで、
より良い社会創りに貢献していきます。
T関する疑問等、小さなことでも遠慮なくお問合せください。3営業日以内にご返答致します。

ご相談・お問合せはこちら
APPSWINGBYのミッションは、アプリでビジネスを加速し、お客様とともにビジネスの成功と未来を形作ること。
私達は、ITテクノロジーを活用し、様々なサービスを提供することで、より良い社会創りに貢献していきます。
IT関する疑問等、小さなことでも遠慮なくお問合せください。3営業日以内にご返答させて頂きます。