コールドスタンバイとは

コールドスタンバイ(Cold Standby)は、システムやサービスの可用性を確保するための災害対策や冗長化の手法の一つで、通常時は停止しており、障害発生時に手動で起動・切り替えを行う予備システムのことです。システムのコストを抑えつつ、ある程度の復旧能力を確保したい場合に採用されます。

コールドスタンバイの基本的な概念

システム運用において、予期せぬ障害(ハードウェア故障、ソフトウェアエラー、自然災害など)は避けられないリスクです。これらの障害が発生した場合でも、サービスを継続したり、迅速に復旧したりするための対策が「可用性(Availability)」の確保です。コールドスタンバイは、この可用性戦略において、稼働中のシステム(本番系)と対になる「待機系」のシステムの状態を表します。

その主な特徴は以下の通りです。

  1. 通常時は停止状態: コールドスタンバイのシステムは、普段は電源がオフになっているか、非常に最小限のリソースしか使用しない状態で稼働しています。データも同期されていません。
  2. 手動による起動・切り替え: 本番システムに障害が発生した場合、運用担当者が手動でコールドスタンバイシステムを起動し、必要な設定(IPアドレス、データなど)を行い、サービスを切り替えます。
  3. 復旧までの時間(RTO): システムを起動し、データを復元し、設定を適用するなどの手順が必要なため、サービス復旧までに比較的長い時間(数時間から数日)がかかります。これは一般的に「目標復旧時間(Recovery Time Objective: RTO)」と呼ばれます。
  4. 復旧時点(RPO): コールドスタンバイは通常、リアルタイムでのデータ同期を行いません。そのため、復旧したシステムは、障害発生直前の最新の状態ではなく、最後にバックアップが取られた時点の状態に戻ることになります。これは「目標復旧時点(Recovery Point Objective: RPO)」と呼ばれます。データ損失は避けられない前提となります。
  5. コスト効率: 待機システムが常に稼働している必要がないため、電力消費やハードウェアリソース、ソフトウェアライセンスなどの運用コストを低く抑えることができます。

コールドスタンバイの仕組みと運用

コールドスタンバイは、以下のような仕組みで運用されます。

  1. 本番システムの稼働とバックアップ: 通常時、本番システムがサービスを提供します。データのバックアップは定期的に(日次、週次など)取得され、コールドスタンバイシステムがアクセスできるストレージ(共有ストレージ、ネットワークストレージなど)に保存されます。
  2. コールドスタンバイシステムの準備: コールドスタンバイシステムは、本番システムと同一または同等のハードウェアとソフトウェア構成で準備されます。OSやアプリケーションはインストール済みですが、通常は起動していません。
  3. 障害発生時の手順:
    • 障害検知: 本番システムの障害を検知します。
    • コールドスタンバイの起動: 運用担当者がコールドスタンバイシステムの電源を入れ、OSと必要なアプリケーションを起動します。
    • データ復元: 最後に取得されたバックアップデータ(データベース、ファイルなど)をコールドスタンバイシステムに復元します。
    • 設定変更: ネットワーク設定(IPアドレスなど)やアプリケーション設定を、本番環境と一致するように変更します。
    • サービス切り替え: ユーザーからのリクエストがコールドスタンバイシステムに向かうように、DNS設定の変更やロードバランサーの設定変更などを行います。

コールドスタンバイのメリットとデメリット

コールドスタンバイは、その特性から特定の状況で適切な選択肢となりますが、デメリットも理解しておく必要があります。

メリット

  • 低コスト: 待機系システムが常に稼働している必要がないため、運用にかかる電力コスト、ハードウェアの消耗、ソフトウェアライセンス費用などを大幅に削減できます。
  • シンプルな構成: 複雑なリアルタイム同期や自動切り替え機構が不要なため、システム構成が比較的シンプルになります。
  • 多様な障害への対応: 本番システムの物理的な損傷やデータセンター全体の障害など、広範囲な災害に対しても対応可能です。

デメリット

  • 長い復旧時間(RTOが長い): 手動での起動、データ復元、設定変更、サービス切り替えなどの手順が必要なため、復旧までに数時間から数日かかることが一般的です。これは、リアルタイム性が求められるサービスには不向きです。
  • データ損失の可能性(RPOが長い): バックアップが定期的にしか取られないため、最後にバックアップが取得されてから障害発生までの間のデータは失われる可能性があります。
  • 手動操作によるリスク: 復旧プロセスに人手がかかるため、手順のミスや連絡の遅れなど、ヒューマンエラーによる復旧の遅延や失敗のリスクがあります。
  • 定期的なテストの必要性: いざという時に確実に機能するかを確認するためには、定期的に復旧訓練(ディザスターリカバリーテスト)を行う必要があります。これには追加のコストと労力がかかります。

コールドスタンバイの適切な適用例

コールドスタンバイは、以下のようなケースで適切な災害対策として採用されます。

  • サービスの停止が許容される場合: 数時間から半日程度のサービス停止がビジネスインパクトとして許容されるシステム。
  • 予算が限られている場合: 可用性確保に多大なコストをかけられないが、最低限の復旧策は講じておきたい場合。
  • データのリアルタイム性が要求されない場合: RPOが長くても(つまり、ある程度のデータ損失が許容されても)問題ないシステム。例えば、週次バッチ処理のデータや、外部に常に最新データがあるシステムなど。
  • 静的なコンテンツ配信: ウェブサイトの静的コンテンツ配信など、更新頻度が低く、かつ一時的な停止が許容されるサービス。

ホットスタンバイ、ウォームスタンバイとの比較

可用性確保のスタンバイ方式には、コールドスタンバイの他に、ホットスタンバイ、ウォームスタンバイがあります。それぞれ、復旧時間とコストのトレードオフがあります。

  • ホットスタンバイ(Hot Standby): 予備システムが常に稼働しており、本番システムとリアルタイムでデータ同期されています。障害発生時には自動的に切り替わるため、RTOは極めて短く、RPOもほぼゼロに近いです。しかし、常に2系統のシステムが稼働しているため、コストは最も高くなります。
  • ウォームスタンバイ(Warm Standby): 予備システムは起動しているが、本番システムほどフル稼働ではなく、リソースを抑えた状態で待機しています。データ同期もリアルタイムではないものの、コールドスタンバイよりは頻繁に行われます。障害発生時には、コールドスタンバイよりは迅速に、ホットスタンバイよりは時間がかかって復旧します。コストと復旧時間のバランスを取った方式です。

コールドスタンバイ(Cold Standby)とは、システムの可用性を確保するための手法の一つで、通常時は停止している予備システムを指します。本番システムに障害が発生した際に、手動で起動・設定・データ復元を行い、サービスを切り替えることで復旧を図ります。

低コストでシステムを構築・維持できるメリットがある一方で、復旧までに時間がかかり(長いRTO)、最後にバックアップが取られた時点までのデータが失われる可能性がある(長いRPO)というデメリットがあります。そのため、サービス停止が許容されるシステムや、予算が限られる場合に主に採用される方式です。ホットスタンバイやウォームスタンバイと比較して、コストと復旧時間のバランスを考慮して選択されます。

関連用語

アクティブ-スタンバイ | 今更聞けないIT用語集
アクティブ-アクティブ | 今更聞けないIT用語集
クラウドソリューション

お問い合わせ

システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。

APPSWINGBYの

ソリューション

APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。

システム開発

既存事業のDXによる新規開発、既存業務システムの引継ぎ・機能追加、表計算ソフトによる管理からの卒業等々、様々なWebシステムの開発を行っています。

iOS/Androidアプリ開発

既存事業のDXによるアプリの新規開発から既存アプリの改修・機能追加まで様々なアプリ開発における様々な課題・問題を解決しています。


リファクタリング

他のベンダーが開発したウェブサービスやアプリの不具合改修やソースコードの最適化、また、クラウド移行によってランニングコストが大幅にあがってしまったシステムのリアーキテクチャなどの行っています。