RAIDとは?複数HDDで安全性と速度を両立するストレージ技術を解説

システム開発・テクノロジー
RAIDとは?ざっくりと3行で
  • Redundant Array of Inexpensive Disksの略(読み:レイド)。複数のHDDをまとめて1つのドライブとして扱い、データの安全性や速度を向上させるストレージ技術だ
  • RAID0・1・5・6・10などのレベルがあり、速度重視か安全性重視かによって使うRAIDレベルが変わる。設計の目的に合ったレベルを選ぶことが重要だ
  • 数字が大きいほど高性能というわけではなく、用途ごとに適したレベルが異なる。サーバー設計の基礎知識として押さえておきたいトピックだ

【深掘り】これだけ知ってればOK!

RAIDの各レベルを超シンプルに覚えるには:RAID0=速いが壊れると全滅RAID1=2台で同じデータを持つ鏡RAID5=3台以上で1台故障まで耐えるRAID6=4台以上で2台同時故障まで耐えるRAID10=RAID1とRAID0の組み合わせで速くて安全というイメージだ。

各RAIDレベルの特徴を整理しよう。RAID0(ストライピング)は複数のディスクにデータを分散して書き込むため、読み書き速度が向上する。しかし1台が壊れると全データが失われる。動画編集など速度が最優先の用途向けだ。RAID1(ミラーリング)は2台のディスクに同じデータを書き込む鏡方式だ。1台が壊れても継続稼働できるが、容量は実質2分の1になる。

RAID5はパリティ情報を分散して保存する方式で、3台以上のディスクのうち1台が故障しても復旧できる。速度と安全性のバランスが取れており、サーバーのストレージとして最も広く使われているレベルだ。RAID6はRAID5を拡張して2台同時故障まで耐えられる。RAID10はRAID1とRAID0を組み合わせた方式で、速度と耐障害性を両立するが最低4台必要でコストが高い。

RAIDはバックアップの代わりにはならないという点を強調しておきたい。RAIDは1台のディスクが壊れてもサービスを継続するためのリアルタイム冗長化であり、誤削除・ランサムウェア・人為的なデータ破壊からは保護できない。RAIDとバックアップは役割が異なり、どちらか一方があれば十分というものではない。

現代のストレージ環境では、オンプレミスのRAIDに加えてクラウドストレージの活用が標準的になっている。AWSのEBSやS3は内部的に高い冗長性を持って設計されており、単一ドライブのRAIDとは別の次元の耐障害性が確保されている。自社サーバーを持つ場合はRAIDの知識が必要だが、クラウドに移行するとRAIDを意識する機会は減っていく。

よくある誤解

RAID数字が大きいほど優れているわけではない

RAID5よりRAID6のほうが耐障害性は高いが、書き込み速度は下がりコストも上がる。RAID10のほうがRAID5より高性能かというと、用途次第で一概には言えない。目的に合ったレベルを選ぶことが重要だ。

RAIDがあればHDDは壊れても大丈夫という油断は禁物

RAIDは同時に発生する故障数が設計値以内であれば継続稼働できるが、故障したディスクを放置して次の故障が起きると全データ喪失になることがある。障害アラートが出たら早急に交換し、リビルドを完了させることが運用上の大前提だ。

会話での使われ方

ITKAGYO運営者のアイコン画像

このサーバー、RAID5で3台構成ですけど、もう1台壊れたらアウトですよ。早めに交換しましょう。

サーバー管理者がRAIDのアラートを確認して同僚に交換を促している場面。

ITKAGYO運営者のアイコン画像

RAID0は速いんですが、映像編集用のワークステーションに使ってて、バックアップはNASに別途取るようにしてます。

クリエイター向け機材相談の場でエンジニアがストレージ構成を説明している場面。

ITKAGYO運営者のアイコン画像

RAIDってバックアップの代わりになるんですよね?とよく聞かれますが、全然違います。RAIDは継続稼働、バックアップは復旧ですから。

新入エンジニア研修でインフラ担当がよくある誤解を解説している場面。

RAIDの歴史

RAIDは1987年に発表された論文から始まり、今日のサーバーストレージの基礎技術として定着した。

出来事
1987年カリフォルニア大学バークレー校のPatterson・Gibson・Katz の3名がRAIDの概念を論文で発表。
1990年代RAIDコントローラーが商業化され、企業向けサーバーのストレージ標準として普及。
2000年代ソフトウェアRAIDが普及し、専用ハードウェアなしにOSレベルでRAIDを構成できるようになった。
2010年代クラウドストレージの台頭でオンプレミスRAIDの新規採用は減少。ただしデータセンターや自社サーバー環境では引き続き活用される。
現在クラウドが主流となった今もオンプレサーバーの基本技術として継続採用。NAS・SAN・HCI(ハイパーコンバージドインフラ)などに組み込まれて使われている。

【まとめ】3つのポイント

  • 「複数のHDDを組み合わせて速度か安全性を向上させる技術」:RAIDはディスク障害時の継続稼働(耐障害性)と読み書き速度向上の両方をレベルに応じて実現するストレージ技術だ
  • 目的に合ったRAIDレベルを選ぶことが重要:RAID0は速度重視・RAID1は安全重視・RAID5はバランス型・RAID10は速度と安全の両立と、数字の大小ではなく用途で選ぶ
  • RAIDはバックアップの代わりにはならない:RAIDは継続稼働のための冗長化でありデータ復旧の仕組みではない。誤削除・ランサムウェア対策には別途バックアップが必要だ

よくある質問

Q
家庭用のNASにもRAIDは使えますか?
A

はい、使えます。SynologyやQNAPなどのNAS製品はRAID1・5・6・10に対応しており、家庭や中小企業でも簡単にRAID構成を組めます。2〜4台のHDDを搭載して重要なデータを保護するのに広く使われています。

Q
RAID5のパリティとは何ですか?
A

パリティとは、データの誤りを検出・訂正するための冗長情報です。RAID5では複数のディスクにデータとパリティ情報を分散保存するため、1台が故障してもパリティからデータを再構築できます。数学的にはXOR演算を使った計算で復元します。

Q
SSDでもRAIDは使えますか?
A

使えます。SSD搭載のRAIDは応答速度が非常に高く、高性能なデータベースサーバーやキャッシュサーバーに使われます。ただしSSDは書き込み回数の上限(TBW)があるため、RAID5・6のパリティ書き込みによるSSDの消耗も考慮した設計が必要です。

Q
RAIDとNASの違いは何ですか?
A

RAIDはストレージの冗長化技術です。NASはネットワーク経由でファイルを共有するためのストレージ装置です。多くのNASはRAIDを内部技術として採用しており、NASの中にRAIDが組み込まれているという関係です。

この用語と一緒に知っておきたい用語

用語この記事との関連
データ本記事のテーマと実務上セットで使われることが多い用語です。コンピュータが処理する数値や文字、画像といった事実や資料そのもの、それがデータだ
ストレージストレージとの関係を知ると全体像がつかみやすくなります。データを永続的に保存・記憶するための装置や仕組みの総称。記憶媒体・記憶装置とも呼ばれ、電源を切ってもデータが消えない永続的な記憶領域を指す
サーバーサーバーを押さえると本記事の理解がさらに深まります。ネットワークを通じて情報やサービスを提供する側のコンピューターのこと。レストランで料理を運んでくれる給仕係(server)をイメージするとわかりやすいよ
バックアップ次のステップとしてバックアップを学ぶと知識が広がります。データの複製を別の場所に保管し、障害・誤削除・ランサムウェアなどのトラブルに備える仕組みおよびその行為のこと
冗長化冗長化を押さえると本記事の理解がさらに深まります。障害が発生しても継続稼働できるように、同じ役割を持つコンポーネントを複数用意するシステム設計の手法だ

【出典】参考URL

https://www.pc-webzine.com/article/2290 :RAIDとスケーラビリティの関連
https://e-words.jp/w/SLA.html :ストレージ冗長化の概念

コメント

「IT用語、難しすぎて心が折れそう……」という方のための、ハードル低めな用語辞典です。

情報レベルは「基礎中の基礎」。会話を止めないためのエッセンスだけを抽出しています。分かりやすさを追求するあまり、時々例え話が暴走しているかもしれませんが、そこは「ほどよく」聞き流していただけると幸いです。
ほどよくIT用語辞典システム開発・テクノロジー
デプロイ太郎のSNSを見てみる!!