データキューブとは

データキューブは、オンライン分析処理(OLAP)ビジネスインテリジェンス(BI)の分野において、大量のデータを多次元的な視点から高速に分析・集計するために、複数のディメンション(次元)とメジャー(指標)で構成された論理的な多次元データ構造のことであり、あらかじめ集計されたデータが格納されるため、リレーショナルデータベース(RDB)に都度クエリを実行するよりも格段に高速な集計・分析を実現し、意思決定を支援するための、データウェアハウス(DWH)環境における主要な分析ツールの一つです。

データキューブの概要と多次元構造

データキューブ(Data Cube)は、データを格納する論理的なモデルであり、従来の2次元(行と列)の表形式(リレーショナルモデル)とは根本的に異なります。キューブという名前が示すように、データを行列ではなく、複数の次元を持つ空間として捉えます。

1. ディメンション(次元)

ディメンションは、データを分析する際の視点や軸となる要素です。データキューブの辺にあたります。

  • : 売上データを分析する場合、「時間(年、月、日)」、「製品(カテゴリ、SKU)」、「地域(国、都市)」、「顧客(年齢層、セグメント)」などがディメンションになります。
  • 特徴: キューブの次元が増えるほど、分析の切り口が詳細になります。3次元を超えるキューブは、ハイパーキューブとも呼ばれます。

2. メジャー(指標)

メジャーは、分析の対象となる定量的な数値データであり、キューブ内の各セルに格納される値です。

  • : 売上データを分析する場合、「売上高」、「販売数量」、「平均利益率」、「在庫レベル」などがメジャーになります。
  • 特徴: メジャーは、ディメンションの組み合わせに基づいて集計されます。

データキューブの仕組みと高速処理の理由

データキューブは、OLAPサーバー上で実装されることが一般的です。分析処理を高速化する主な理由は、データの事前集計にあります。

1. 事前集計(Pre-Aggregation)

データウェアハウス(DWH)からデータキューブを作成する際、システムは考えられるディメンションの組み合わせの多くに対して、集計処理(合計、平均、最大/最小など)をあらかじめ実行し、その結果をキューブのセルに格納します。

  • : 「2024年1月」の「東京」の「製品A」の「売上高」が、事前に計算されて格納されます。
  • 高速化の原理: ユーザーが分析クエリ(例:「全地域における製品Bの四半期ごとの売上合計」)を実行した際、RDBのように毎回膨大な生データに対して集計処理を行う必要がなく、すでに計算済みの集計結果をキューブから読み出すだけで済むため、レスポンス時間が劇的に短縮されます。

2. スパース性と圧縮

データキューブの中には、データの値が存在しないセル(例:2024年に未販売の製品)が多く含まれることがあります。このような状態をスパース性(疎)と呼びます。効率的なストレージ管理のために、OLAPエンジンはスパース性を利用して、データキューブを圧縮する技術を用いています。

OLAP分析操作

データキューブは、多次元的な分析を行うための特有の操作を提供します。

1. ドリルダウン(Drill Down)とロールアップ(Roll Up)

  • ドリルダウン: より詳細なレベルへ分析の視点を深める操作。例:「四半期ごとの売上」から「月ごとの売上」へ。
  • ロールアップ: より粗い、集約されたレベルへ分析の視点を広げる操作。例:「都市別売上」から「国別売上」へ。

2. スライス(Slice)とダイス(Dice)

  • スライス: 特定のディメンションで単一の要素を選択し、キューブの一部を切り出す操作。例:「時間」ディメンションにおいて「2024年第2四半期」だけを固定して切り出す。
  • ダイス: 複数のディメンションで特定の範囲を選択し、サブキューブを切り出す操作。例:「地域」ディメンションで「東日本」を、「製品」ディメンションで「電子機器」を選択して部分キューブを作成する。

これらの操作により、ユーザーは多角的な視点からデータを柔軟かつ高速に探索し、ビジネス上のインサイトを発見することが可能になります。

関連用語

OLAP | 今更聞けないIT用語集
BI:ビジネスインテリジェンスツール | 今更聞けないIT用語集
APPSWINGBYシステム開発

お問い合わせ

システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。

APPSWINGBYの

ソリューション

APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。

システム開発

既存事業のDXによる新規開発、既存業務システムの引継ぎ・機能追加、表計算ソフトによる管理からの卒業等々、様々なWebシステムの開発を行っています。

iOS/Androidアプリ開発

既存事業のDXによるアプリの新規開発から既存アプリの改修・機能追加まで様々なアプリ開発における様々な課題・問題を解決しています。


リファクタリング

他のベンダーが開発したウェブサービスやアプリの不具合改修やソースコードの最適化、また、クラウド移行によってランニングコストが大幅にあがってしまったシステムのリアーキテクチャなどの行っています。