オブジェクトストレージとは?S3が代表の無限に広がる保管庫を解説

システム開発・テクノロジー
オブジェクトストレージとは?ざっくりと3行で
  • データをオブジェクト(データ本体+メタデータ+一意のID)という単位で管理するストレージ形態。フォルダ階層を持たないフラットな構造で、どこからでもHTTP(S)でアクセスできる
  • AWS S3・Google Cloud Storage・Azure Blob Storageが代表例。ペタバイト規模まで自動でスケールし、画像・動画・ログ・バックアップの大量保管に最適だ
  • ファイルストレージのように頻繁な上書きには向かないが、一度書いたら変更頻度が低い非構造化データの保管コストはブロックストレージの10分の1以下になることもある

【深掘り】これだけ知ってればOK!

オブジェクトストレージの「オブジェクト」は、データ本体+メタデータ(データの説明情報)グローバルに一意なIDの3要素で構成される。このメタデータの柔軟性が検索性を高め、画像ならばカメラ情報・位置情報まで一緒に保存・検索できる強みを生む。

オブジェクトストレージが他の2種類と根本的に異なる点はHTTPで直接アクセスできることだ。ブロックストレージやファイルストレージはストレージプロトコルが必要で、通常はサーバー越しにしかアクセスできない。S3のオブジェクトURLを公開設定にすれば、ブラウザから直接ダウンロードできる。これがWebサービスの静的ファイル配信や画像配信に最適な理由だ。

コスト面でも際立つ。AWS S3の標準ストレージクラスは1GBあたり月額約3円(東京リージョン)、ほとんどアクセスしないデータ用のGlacierなら0.5円以下になる。100TBのデータをS3 Glacierに保存しても月額約5万円という計算だ。同量のEBS(ブロックストレージ)と比べると数十分の一のコストで済む場合もある。

オブジェクトストレージの注意点はデータの一貫性モデルだ。S3は歴史的に結果整合性(Eventual Consistency)モデルを採用していたため、書き込み直後に読み込むと古いデータが返ることがあった。2020年12月のアップデートで強整合性に変更されたが、設計時には一貫性モデルの理解が重要だ。

実務での活用パターンを押さえよう。静的WebサイトのホスティングはHTMLファイルをS3に置くだけでWebサイトが公開できる。CDNとの組み合わせでS3に置いた画像をCloudFrontで世界中に高速配信する構成はWebサービスの定番だ。バックアップ・アーカイブとしてRDSスナップショットの保存先にもなる。

よくある誤解

オブジェクトストレージは全てのデータに向いているわけではない

頻繁に書き換えが必要なデータベースのデータにはブロックストレージが適切だ。オブジェクトストレージは書き込んだらほとんど変更しない動画・画像・ログ・バックアップデータに最も向いている。

S3のバケットはデフォルトで非公開だが設定ミスが多い

S3バケットの誤った公開設定による情報漏洩は繰り返し発生しているセキュリティ事故だ。不必要にバケットを公開しない・IAMポリシーを最小権限で設定する・S3 Block Public Accessを有効にするのが基本対策だ。

会話での使われ方

ITKAGYO運営者のアイコン画像

ユーザーがアップロードする画像はS3に保存して、URLをDBに持たせる設計にしてます。サーバーストレージを圧迫しないですし、コスト的にも最適です。

バックエンド設計レビューでエンジニアがアーキテクチャ方針を説明している場面。

ITKAGYO運営者のアイコン画像

S3のバケットポリシー、パブリックアクセスブロックちゃんとかかってますか?先月他社で設定ミスで個人情報流出してましたよ。

セキュリティレビューで担当者が設定確認を促している場面。

ITKAGYO運営者のアイコン画像

動画ファイルの配信はS3+CloudFrontの組み合わせで、アクセスされない古い動画はGlacierに移してコスト削減してます。

インフラコスト最適化プロジェクトの報告会で担当者が施策を紹介している場面。

【まとめ】3つのポイント

  • 「フラット構造でHTTPアクセスできる非構造化データの保管庫」:オブジェクトストレージはフォルダ階層なしにIDで管理し、HTTP経由で直接アクセスできる。画像・動画・ログの大量保管に最適だ
  • ブロックストレージの数十分の一のコストで大量保管できる:アクセス頻度に応じたストレージクラスを使い分けることでコストを最適化しながらペタバイト規模まで対応できる
  • バケットの公開設定ミスが最大のセキュリティリスク:S3のパブリックアクセスブロックとIAMポリシーの最小権限設定は必須の安全対策だ

よくある質問

Q
AWS S3とは何ですか?
A

Amazon Simple Storage Serviceの略で、AWSが提供するオブジェクトストレージサービスです。1バケット(容量制限なし)・99.999999999%の耐久性・HTTP経由のアクセスが特徴で、世界で最も広く使われているクラウドストレージです。

Q
オブジェクトストレージはNASの代替になりますか?
A

用途によります。ファイル共有・高頻度な更新・低遅延アクセスが必要な用途にはNASが向いています。バックアップ・アーカイブ・大量の静的コンテンツ配信にはオブジェクトストレージのほうがコスト効率が高くなります。

Q
オブジェクトストレージのコストはどのくらいですか?
A

AWS S3東京リージョンの場合、標準クラスで1GBあたり月額約3円です。アクセスほぼゼロのアーカイブデータはGlacier Deep Archiveで1GBあたり月額0.2円程度まで下がります。データ容量・アクセス頻度・転送量の3つでコストが決まります。

Q
オブジェクトストレージとファイルストレージの違いは何ですか?
A

ファイルストレージはフォルダ・ファイルの階層でデータを管理し、ファイルシステムプロトコルでアクセスします。オブジェクトストレージはフラットなIDで管理しHTTPでアクセスします。更新頻度の高いファイルにはファイルストレージ、大量の静的コンテンツにはオブジェクトストレージが向いています。

この用語と一緒に知っておきたい用語

用語この記事との関連
ストレージストレージとの関係を知ると全体像がつかみやすくなります。データを永続的に保存・記憶するための装置や仕組みの総称。記憶媒体・記憶装置とも呼ばれ、電源を切ってもデータが消えない永続的な記憶領域を指す
データ本記事のテーマと実務上セットで使われることが多い用語です。コンピュータが処理する数値や文字、画像といった事実や資料そのもの、それがデータだ
ファイルストレージファイルストレージとの関係を知ると全体像がつかみやすくなります。データをフォルダとファイルの階層構造で管理するストレージ形態。Windowsのエクスプローラーで見るフォルダ構成がそのまま共有されるため、IT初心者でも直感的に使える
ブロックストレージブロックストレージを押さえると本記事の理解がさらに深まります。データを固定長のブロックという単位に分割して保存するストレージ形態。物理ディスクに直接マウントされる形でOSからは通常のHDD・SSDと同じように見える
バックアップ次のステップとしてバックアップを学ぶと知識が広がります。データの複製を別の場所に保管し、障害・誤削除・ランサムウェアなどのトラブルに備える仕組みおよびその行為のこと

【出典】参考URL

https://www.redhat.com/ja/topics/data-storage/file-block-object-storage :3種類のストレージ比較
https://www.softbank.jp/biz/blog/business/articles/202007/storage-difference/ :オブジェクトストレージの詳細解説

コメント

「IT用語、難しすぎて心が折れそう……」という方のための、ハードル低めな用語辞典です。

情報レベルは「基礎中の基礎」。会話を止めないためのエッセンスだけを抽出しています。分かりやすさを追求するあまり、時々例え話が暴走しているかもしれませんが、そこは「ほどよく」聞き流していただけると幸いです。
ほどよくIT用語辞典システム開発・テクノロジー
デプロイ太郎のSNSを見てみる!!