
「Snowflake」とは、クラウド型のプラットフォームです。大量のデジタルデータ管理が求められる現代において、デジタルデータの一元管理に優れたプラットフォームとして注目を集めています。本記事では、概要から特徴やメリット、デメリットについて解説します。

「Snowflake」とは
「Snowflake」とは、Snowflake社が提供するSaaS型のデータウェアハウスです。AWSやGCP、最近ではAzureといったクラウドサービス上で動作します。大量のデジタルデータを取り扱う機会が増えている現代では、コストを抑えてデータを格納できるストレージの需要が増えています。「Snowflake」を活用することで、労力をかけずに半構造化データも含めたデジタルデータの一元管理が可能です。「Snowflake」はデータウェアハウスとしての機能だけでなく、データレイクとしての機能も持つプラットフォームと言えます。
データウェアハウスとは
データウェアハウスとは、データを格納する倉庫のことです。DWHとも表記されます。売上や在庫、顧客情報といったデータをデータベースとして活用できるように、データを構造化する機能を持っています。データレイクとの違いは、データを構造化する機能を持っている点です。顧客の購入履歴を保存しておけば「誰が・何を・いつ・どれだけ」購入したのかを確認できるため、分析や生産に活用できます。
関連記事:DWH(データーウェアハウス)のメリットや似た用語との違いを解説
データレイクとは
データレイクもデータを格納する倉庫です。ただし、データウェアハウスのようにデータを構造化する機能はありません。データレイクでは構造化されていないデータに対し「タグ」をつけて格納します。これにより、形式が異なるデータを関連付けられるため、分析するためにデータを加工する必要がありません。そのため、ビッグデータの保存形式として注目されています。
ただし、用途を考慮せずにデータを保存することはした場合、分析には必要ないデータも紐づけられます。結果的に分析しにくくなるため、データの用途を定めたうえでデータを格納することが必要です。
関連記事:ビッグデータの活用事例5選|活用するメリットや分析方法を徹底解説

「Snowflake」の何がすごい?その特徴とは
「Snowflake」にはさまざまな特徴があり、その中でも代表的な特徴は以下の3つです。
● データシェアリング
● マルチクラウドプラットフォームに対応
● データ共有とエコシステム
ここでは、「Snowflake」の代表的な特徴3つについて解説します。
データシェアリング
「Snowflake」の特徴として、データシェアリングが挙げられます。データシェアリングは、自分の管理するリソースを使って他者の保管データにアクセスする機能です。「Snowflake」はクラウドの利点を活かし、データの格納場所とデータ処理を論理的に統合したうえで物理的に切り離しています。それにより、データウェアハウスが抱えていた課題を解決しました。
例えば自分のデータを他者に見せる場合、複製したデータを他者に送る必要があります。データの複製にはリスクが発生します。しかし、データシェアリングでは自分のデータを直接他者に見せることが可能です。そのため、データ複製によるリスクを抑えられます。
マルチクラウドプラットフォームに対応
2つ目の特徴は、マルチクラウドプラットフォームに対応していることです。AWSやAzure、GCPといった、信頼性が高いプラットフォームに対応しています。日本国内では、AWS東京リージョンやAzure東日本リージョンに対応しています。世界中のリージョンへの対応も進んでいるため、地域を跨いだデータ連携も可能です。使用しているクラウドでシステム障害が発生した場合でも、環境を切り替えられるため、緊急事態発生時でも事業を継続できます。
データ共有とエコシステム
3つ目の特徴は、データ共有とエコシステムです。「Snowflake」は、クラウド上にデータがあるため、遠く離れた組織と安全にデータを共有できます。データ共有の仕組みを活かし、「Snowflake」データマーケットプレイスには、500以上のデータが世界中の企業から提供されています。それにより、顧客にとどまらず電力や気象データといった経営に関係するデータの入手が可能です。プロバイダーとしてデータマーケットプレイスに参加すれば、自社データを他社に販売できるため、ビジネスとしても発展させられます。
また、InformaticaやTableau、DataRobotといったエコシステムとの連携もできます。これまでに使用していたツールとInformaticatなどの新しいシステムを組み合わせることも可能です。

「Snowflake」のメリット
「Snowflake」の代表的なメリットとして、高速データ処理やインフラ管理が不要、高度なセキュリティ機能が搭載されていることが挙げられます。どのメリットも、「Snowflake」の機能がもたらした効果です。また、データ量に応じた料金体系であることもメリットのひとつです。ここでは、「Snowflake」のメリットについて解説します。
高速データ処理
「Snowflake」のメリットとして挙げられるのは、高速データ処理ができることです。前述したように、「Snowflake」はデータの格納場所とデータ処理を切り離しています。データ処理にMPP(大規模並列処理)コンピュートクラスタを使ってデータを並列処理することで、高速処理しているのです。それにより、これまでのデータウェアハウスでは必要不可欠となっていたパフォーマンスチューニングに、労力をかける必要がありません。また、並列処理することで、稼働したままパフォーマンスを改善できます。
インフラ管理 が不要
2つ目のメリットは、インフラ管理が不要なことです。「Snowflake」は、SaaS型のプラットフォームのため、自社でハードウェアやソフトウェアを保有する必要がありません。そのため、これまでのデータウェアハウス運用ではネックとなっていた、ソフトウェアのアップデートやバックアップ、インフラなどの面倒な管理業務も不要です。管理業務に時間を取られることがないため、分析や集計といった必要な業務に集中できます。
高度なセキュリティ機能を搭載
3つ目のメリットは、高度なセキュリティ機能が搭載されていることです。「Snowflake」には、ダイナミックデータマスキングやエンドツーエンド暗号化といったセキュリティ機能が搭載されています。ダイナミックデータマスキングとは、あらかじめ作成しておいたマスキングポリシーをデータに反映する機能です。権限がない人が、データを確認できないような処理を実行できます。
エンドツーエンド暗号化とは、送信元側のデバイスでデータを暗号化し、送信元側と送信先側のデバイスでのみ復号できる処理をすることです。送信元と送信先以外はデータを閲覧できないため、第三者に傍受されても簡単には解読されません。他のサービスでは、データ共有時に権限を付与したりアクセス用パスを準備したりと手間がかかりますが、「Snowflake」であれば、データ共有時にセキュリティ対策に関する手間がかかりません。
セキュリティに気を遣う必要なく、データを保護できるだけでなく、業務に集中できることもメリットです。
データ量に応じた料金体系
4つ目のメリットは、データ量に応じた料金体系となっていることです。「Snowflake」は、仮想ウェアハウスとストレージを使用した時間と量に応じて料金が決まります。
仮想ウェアハウスの料金設定の基準は、クラウドコンピューティングのスペックと処理にかかった時間です。一方、ストレージの料金設定の基準は保存されているデータ容量です。料金は1TBあたりで設定されています。使った分だけ料金が発生するため、無駄なコストがかからないことがメリットと言えるでしょう。

「Snowflake」のデメリット
「Snowflake」にはさまざまなメリットがある一方、オンプレミスでは使いにくいことや、仮想ウェアハウスの費用は秒単位で発生するといったデメリットが存在します。どちらのデメリットもメリットの裏返しといえる内容です。ここでは、「Snowflake」のデメリットについて解説します。
オンプレミスでは使いにくい
「Snowflake」のデメリットとして挙げられるのは、オンプレミスでは使いにくいことです。オンプレミスとは、サーバーやソフトウェアを自社で保有している利用形態を指します。「Snowflake」はSaaS型であるため、自社でサーバーを構築する必要がないことはメリットです。
しかし、すでに自社サーバーを構築している場合、データの保存先が複数発生することになり、かえって混乱する可能性があります。自社の環境に対し、「Snowflake」の利用が適しているのかを検討したうえで導入しましょう。AWSやGCPを導入しているのであれば、無料トライアルでテスト導入してみるのもひとつの方法です。
仮想ウェアハウスの費用は秒単位で発生する
仮想ウェアハウスの費用が、秒単位で発生することはデメリットと言えます。仮想ウェアハウスは、使用した分だけしか料金が発生しません。しかし、料金が発生する単位は「秒」です。そのため、データ容量が大きなデータを短時間で使うよりも、小さなデータを長時間使った方が総合的な料金が高くなる可能性があります。処理にかかる時間とデータ容量を計算したうえで、データの処理方法を使い分ける必要があるでしょう。

まとめ:「Snowflake」はデータ共有に優れたプラットフォーム
「Snowflake」とは、データウェアハウスとしての機能だけでなく、データレイクとしての機能も持つプラットフォームです。「Snowflake」の活用により、労力をかけずに半構造化データも含めたデジタルデータの一元管理ができます。「Snowflake」の代表的な特徴として「データシェアリング」「マルチクラウドプラットフォームに対応」「データ共有とエコシステム」の3つが挙げられます。
「Snowflake」は、高速データ処理やインフラ管理が不要、高度なセキュリティ機能が搭載されているといった「Snowflake」の機能がもたらした効果以外にも、データ量に応じた料金体系であることがメリットです。一方、オンプレミスでは使いにくいことや、仮想ウェアハウスの費用は秒単位で発生することはデメリットです。メリットとデメリットを理解し、自社の環境に適しているのかを検討したうえで導入しましょう。