Amazon S3 GlacierおよびAmazon S3 Glacier Deep Archiveは、
Amazon Web Services(AWS)が提供する、低コストで信頼性の高い
オンラインストレージサービスです。主にデータのアーカイブやバックアップを目的としており、長期的なデータ保存に適した設計となっています。
Amazon S3 Glacier
Amazon S3 Glacierは、アクセス頻度が低いデータを長期間保存するのに最適なサービスです。データの取り出しには3〜5時間かかりますが、その分ストレージコストが非常に低く抑えられています。2020年1月時点の東京リージョンでの料金は、1ギガバイトあたり月額0.005ドルと、同じくAmazonが提供するSimple Storage Service(S3)よりも大幅に安価です。
データの書き込みはリアルタイムで行われますが、取り出しはWeb上でリクエストを行い、その後3〜5時間後にメールで送られてくるURLからアクセスすることで実行されます。この取り出しに時間がかかる点が、まるで20世紀中頃の長距離電話の申し込みのようだと例えられます。しかし、バックアップデータは通常、事故が発生しない限りほとんど利用されないこと、また、必要な場合でも多少の遅延が許容されることを考慮すると、非現実的とは言い切れません。むしろ、利用頻度が極めて低い「歴史的な」データの保存など、低コストを活かせる分野に適しています。
Amazonは、このような取り出しに時間がかかるストレージサービスを「コールドストレージ」と呼んでいます。これは、冷凍保存された品物が解凍されるまで使えない状況に例えたもので、「Glacier」(氷河)というサービス名も、このコンセプトに基づいていると考えられます。
Amazon S3 Glacier Deep Archive
Amazon S3 Glacier Deep Archiveは、さらにアクセス頻度が低いデータを対象としたサービスです。1年に1〜2回程度のアクセスを想定しており、データの取り出しには約12時間を要します。しかし、その分料金はさらに低く、2020年1月時点で1ギガバイトあたり月額0.002ドル(東京リージョン)と、Amazon S3 Glacierよりも安価です。
Amazonは、これらのサービスを通じて、ユーザーがオンプレミスのテープバックアップドライブから、クラウドベースのバックアップサービスに移行することを期待しています。
ストレージの技術
ZDNetの記事によると、Glacierは「低価格の市販ハードウェアコンポーネント」を使用しているとされています。具体的には、大容量で低コストのハードディスクが多数使用され、独自のロジックによるカスタムラックで運用されている可能性が高いです。ただし、実装の詳細については公には明らかにされていません。低RPM(回転数)のハードディスクドライブが使用されている可能性も指摘されています。
コストの詳細
データのアップロードは無料ですが、ダウンロード(取り出し)は課金されます。Glacierからのデータ取り出しは、まずGlacierからS3ストレージにデータを移動させ、その後S3ストレージから実際にダウンロードするという2段階のプロセスで、それぞれに料金が発生します。
Glacierは月5%まで無料と謳っていますが、これは1時間ごとに無料取り出しができる0.006944%(1ヶ月を30日として計算)に分散されており、1時間ごとの無料枠を超えた分には超過料金が課金されます。このため、大量のデータを取り出す場合は、できるだけ長い時間をかけて分散してダウンロードすることで、コストを抑えることが重要になります。Glacierを利用するアプリケーションを開発する際には、データの取り出しを長期間に分散するメカニズムを実装するなど、料金体系を理解した上で注意する必要があります。例えば、ユーザーが15GBのデータを保存し、テストで693MBを取り出した際、取り出し率の計算ミスによって126GB分の料金が請求された例も報告されています。
同一リージョン内のEC2クラウドへの転送は無料ですが、AWSリージョン間のデータ転送には1GBあたり$0.02の料金がかかります(東京リージョンからのダウンロードは1GBあたり$0.09)。Glacierから
インターネットへの転送は、月1GBまでの無料転送量を超えるとスライド制課金が適用され、最初の1GBは$0.12かかります。Glacierに保存されたデータを3ヶ月以内に削除した場合も1GBあたり$0.03の料金が発生します。このように、Glacierはリアルタイムアクセスが必要な場合には不向きであり、その場合はS3などの別のストレージサービスを利用することが推奨されています。GlacierはAWS S3よりも最大90%安価であるとされています。
リセラー
Glacierの複雑な課金体系やネットワークアーキテクチャは、一般消費者や小規模オフィスにとっては導入のハードルが高い場合があります。そこで、Glacierをバックボーンストレージとして利用し、Windows、
MacOS、iOS、AndroidなどのOS向けに使いやすい専用のユーザーインターフェースとポータルサーバを開発し、自社ブランドで定額料金のクラウドストレージサービスを提供する企業が現れています。AmazonもAPIを公開しており、これらの企業への販売促進を図っています。
2013年8月時点で、以下の企業がGlacierを利用したクラウドストレージサービスを提供していることが確認されています。
Pogoplug:年額$49.95で無制限
Zoolz:年額$30で無制限
これらのサービスは、月額$5以下の定額料金で無制限のストレージを提供することを売りにしていますが、Glacierを利用していることは公表していません。また、データの取り出しに3〜5時間かかることについても、控えめに説明されています。これらの企業は、法人向けには即時取り出しが可能なストレージサービスも提供していますが、こちらはバックボーンストレージにAmazon S3を使用しており、月額料金は高額です。
参考情報
公式ウェブサイト
Introduction to Amazon Glacier - YouTube
* Cost Comparison: Amazon Glacier vs S3