ホットスタンバイの仕組み:安全なシステムを保つ方法

ざっくりと

  • 同一環境を複数用意
  • システムダウン時に即切替
  • リアルタイムでデータミラーリング

ホットスタンバイとは、障害時の迅速なシステム切替です。

概要説明

ホットスタンバイとは、システムの同一環境を複数用意しておく方法である。なぜならば、メインのシステムがダウンした時に、待機中のシステムが直ちにデータを引継ぎ、作業の中断を最小限に抑えるから。

例えば、銀行のシステムがダウンしても、ホットスタンバイのシステムがすぐに動作を開始する。 そして、これにより顧客はほとんど影響を受けずにサービスを利用できる。

つまり、ビジネスの継続性を高め、顧客への信頼を保つ手段である。 だから、大規模なシステムでよく採用される。

職業職種

  • システム管理者
    システム管理者は、ホットスタンバイを設定・管理する。なぜなら、システムの安定稼働が職務の一部だから。例えば、データセンターの運用。
  • CTO(最高技術責任者)
    CTOは、ホットスタンバイの導入を決定する。なぜなら、企業の技術戦略を担当し、システムの信頼性を確保する役割があるから。例えば、新しいプロジェクトの計画。
  • ネットワークエンジニア
    ネットワークエンジニアは、ホットスタンバイのネットワークを設計・構築する。なぜなら、システム間の通信の安定性が求められるから。例えば、冗長化されたネットワークの設計。

ホットスタンバイは、名前の由来は「常に待機している状態」からです。”Hot”は「活発な」、”Standby”は「待機」を意味し、システムがすぐに切り替わる状態を指す言葉です。

代表例

  • Oracle
    Oracleは、ホットスタンバイで有名である。なぜなら、データベースの高可用性を提供する「Oracle Data Guard」の機能の一つとして、ホットスタンバイが実装されているから。例えば、主要なデータベースがダウンした場合、Oracle Data Guardが自動でスタンバイデータベースに切り替える。
  • Red Hat
    Red Hatは、ホットスタンバイで名高い存在である。なぜなら、Red Hat Enterprise Linuxには、高可用性クラスタリングのソリューションが含まれており、これによってホットスタンバイの設定が可能だから。例えば、サーバーの一つが故障した場合、他のサーバーが自動でその役割を引き継ぐ。
  • Cisco Systems
    Cisco Systemsは、ホットスタンバイで世間に知られている。なぜなら、ネットワーク機器の冗長化技術として「HSRP(Hot Standby Router Protocol)」を開発し、業界標準として広く採用されているから。例えば、主要なルータがダウンした場合、HSRPによってバックアップルータが即座にトラフィックを引き継ぐ。
  • Netflix
    Netflixは、ホットスタンバイで有名である。なぜなら、高い可用性を保つために複数のデータセンターにわたってシステムを分散しているからだ。例えば、一つのデータセンターで障害が発生した場合、他のデータセンターがすぐにサービスを引き継ぐ。
  • LINE
    LINEは、ホットスタンバイで名高い存在である。なぜなら、メッセージングサービスが24時間365日途切れることなく提供されるよう、複数のサーバを用意しているからだ。例えば、メインのサーバがダウンした場合、待機中のサーバが即座に動作を開始する。
  • PayPal
    PayPalは、ホットスタンバイで世間に知られている。なぜなら、金融取引の安全性を確保するために、常に複数のシステムが待機しているからだ。例えば、システムに障害が発生した場合でも、別のシステムがすぐに機能を引き継ぎ、サービスの中断を最小限に抑える。

手順例

以下は、ホットスタンバイの設定手順です。
  1. システムの複製を作成
    システムの複製を作成する。なぜなら、障害時に切り替えるための待機システムが必要だからだ。例えば、メインのサーバと同じ設定のサーバを用意する。
  2. データの同期を設定
    データの同期を設定する。なぜなら、メインと待機のシステム間でデータが一致していなければならないからだ。例えば、リアルタイムでのデータミラーリングを行う。
  3. 監視システムを導入
    監視システムを導入する。なぜなら、障害をいち早く検知して切り替えを行うためには、システムの状態を常に監視する必要があるからだ。例えば、ZabbixやNagiosを使用する。
  4. 自動切り替えの設定
    自動切り替えの設定を行う。なぜなら、障害発生時に迅速に切り替えを行うためには、自動での切り替えが可能でなければならないからだ。例えば、負荷分散装置やクラスタリングソフトウェアを設定する。
  5. 定期的なテスト
    定期的なテストを行う。なぜなら、実際の障害時に確実に切り替えが行えるように、事前にシステムの動作を確認しておく必要があるからだ。例えば、月に一度の切り替えテストを実施する。

類似語

  • アクティブ・スタンバイ
    アクティブ・スタンバイは、ホットスタンバイの類似語である。なぜなら、一方のシステムがアクティブで、もう一方のシステムが待機している状態を指すからだ。例えば、データベースのレプリケーション設定。
  • フェイルオーバー
    フェイルオーバーは、ホットスタンバイの類似語である。なぜなら、システムの障害時に自動で別のシステムに切り替える機能を指すからだ。例えば、ロードバランサが健康状態を監視し、障害が発生したら別のサーバにトラフィックを切り替える。
  • ミラーリング
    ミラーリングは、ホットスタンバイの類似語である。なぜなら、一方のシステムのデータをもう一方のシステムにリアルタイムでコピーして同期を保つことを指すからだ。例えば、ストレージのRAID 1設定。

反対語

  • コールドスタンバイ
    コールドスタンバイは、ホットスタンバイの反対語である。なぜなら、システムがダウンした時に、待機システムを手動で起動し、データを復元する時間が必要だからだ。例えば、災害時にバックアップからデータを復元する場合。
  • アクティブアクティブ
    アクティブアクティブは、ホットスタンバイの反対語である。なぜなら、両方のシステムが同時に稼働し、負荷を分散しているからだ。例えば、両方のサーバが同時にユーザのリクエストを処理する場合。
  • マニュアルスイッチ
    マニュアルスイッチは、ホットスタンバイの反対語である。なぜなら、システムの切り替えを人の手で行う必要があるからだ。例えば、メインのシステムがダウンした時に、人が介入してバックアップシステムに切り替える場合。

会話例

  • データセンターでの作業
    「この新しいシステム、万が一の障害にどう対処するの?」
    「ホットスタンバイの設定をしているから、メインのシステムがダウンしても、待機システムが自動で動き出すよ。」
  • ITチームの会議
    「最近のダウンタイムが多いけど、解決策は?」
    「ホットスタンバイを導入して、システムの冗長性を高めることを提案するよ。」
  • クライアントとの打ち合わせ
    「サービスが途切れることなく稼働する保証は?」
    「ホットスタンバイのシステムを構築しているので、一つのシステムが停止しても、もう一つがすぐに引き継ぎます。」

注意点

ホットスタンバイを使用する時の注意点はコストである。なぜならば、待機システムも常に稼働しているため、ハードウェアや電力のコストが倍になる可能性があるからだ。

例えば、サーバやネットワーク機器の購入費用である。そして、定期的なメンテナンスも必要だ。だから、予算の計画をしっかり立てることが大切。

ホットスタンバイとウォームスタンバイは、間違えやすいので注意しましょう。

ホットスタンバイは、待機システムが常にデータを同期し、即座に切り替えが可能です。

一方、ウォームスタンバイは、待機システムは定期的にデータを更新し、切り替えに少し時間がかかります。

記事を書いてる人

ガラケー時代からWEB開発やってる自宅SE です。

「○○を知りたい!!」「○○が分からない!!」などありましたら、Twitterでもブログでもコメントいただければ、ご期待に添えるように頑張ります!

ネット事件簿チャンネルを運営しているので、YouTubeもぜひ覗いてみてください!!

雨おやじのSNSを覗く!!
IT用語辞典
雨おやじのSNSを覗く!!
ITkagyo

コメント