掲載日:2023/03/24
高性能のCloudサービスとして、Google提供のデータウェアハウス『BigQuery』が注目されています。本記事では、高性能で多くのメリットを有し、コストパフォーマンスにも優れている同ツールとは何か、特徴や用途などについて解説します。
『BigQuery』とは?2つの機能
Googleが提供する『BigQuery』は、大容量のデータを超高速にて解析できるCloudサービスです。テラバイトやテラバイトの千倍であるペタバイト単位のビッグデータであっても、わずか数秒から数十秒で処理できる能力を持っており、これまでのデータ処理時間が一気に短縮される驚くべきサービスでもあります。
それでは『BigQuery』がどのように利用されて膨大な容量のデータ解析を行うのか、『BigQuery』の主な性能について以下に解説します。
1.膨大なデータの解析
SNSやソーシャルゲームを運用する際には「アクセスログ」「システムログ」「アプリケーションログ」などすべてのデータを保存する必要があります。開発企業は保存されたこれらのデータを解析してサービス改善を行い、サービスを運営しています。
従来の解析サービスでは、データが大容量になればなるほど時間を要していました。数億行にも達するこれら膨大なデータ解析作業を短時間で可能にするサービスが『BigQuery』です。
2.クエリ高速化機能によるリアルタイム分析
『BigQuery』では、データサービスに命令を下す「クエリ」の高速化を実現しただけでなく、データ保存が解析と同時にリアルタイムで実行できる利便性があります。また、120億行もの正規表現マッチ付き集計を、なんと数十秒で完了する機能を有しており、移動中の車両の最適な走行ルート割り出しや、的確なスケジュール管理を素早く作成することなどが可能になりました。
世界中で運用されているサービスのデータ容量は今後も増加すると想定されます。それに伴って、『BigQuery』のような高機能を有する、新しいデータ解析サービスの利用価値はさらに高まってくることでしょう。
『BigQuery』の超高速処理を生む2つの仕組み
『BigQuery』の最大の特徴は「データの超高速処理」の実現です。大容量のデータを処理するクエリに対しては独自に開発された『BigQuery』特有の2つの仕組みについて下記に解説します。
1.カラム型データストア
従来のデータベースでは、横位置の行単位で読み込み保存しています。これに対し、『BigQuery』では縦位置の列単位で読み込み・保存するのが相違点です。
同列内のデータは類似性が高く、圧縮率は通常の3倍も高まるとされています。『BigQuery』の読み込み・保存方式により、クエリ処理が列データのみのアクセスとなるため、インターネット通信量であるトラフィックが最小化される効果を生んでいます。
2.ツリーアーキテクチャ
『BigQuery』では、大容量のデータを複数同時に処理するというクエリに対し、ツリーアーキテクチャ構造で広げながら同時に並列処理する仕組みがあります。この仕組みにより、大規模なクエリを高速で分散処理することが可能となりました。
『BigQuery』を使う3つのメリット
『BigQuery』にはいくつもの便利さがあり、特に大容量データの処理に時間と労力をかけていた企業から大きな評価を得ています。『BigQuery』を利用する上での数ある有効性の中でも、代表的とされるユーザーにとってのメリットを以下に3点挙げ、その内容について解説します。
1.サーバーレスで利用でき専門知識が不要
『BigQuery』を利用するメリットとして「専門知識が不要」という点が第一に挙げられます。従来の方式とは異なり、『BigQuery』はサーバーを使わずチューニング不要で利用できる点が大きな特徴です。
通常はデータサイエンティストが最適なシミュレーションを行うことでパフォーマンスが発揮されます。その点、サーバーレス方式の『BigQuery』ではデータベースに関するクエリにおいて必要であったインデックスも不要なほか、誰でも『BigQuery』を利用して大容量のデータ分析が可能です。
2.『Google Cloud』とシームレスに連携できる
『BigQuery』は、Googleから提供されている他のCloudサービスとの「シームレス連携」が可能です。 GoogleのCloudサービスであるデータ分析プラットフォーム「Looker」とシームレス連携し、データの統合や分析・変換だけでなく、レポーティングや可視化も行えます。
他にも、クエリで導かれた成果をAIにシームレス連携させる「BigQuery ML」の機械学習サービスなども活用できる点が魅力です。
3.コストパフォーマンスに優れている
従来のDWH(データウェアハウス)と比較して、『BigQuery』は低コストで運用できる点も大きなメリットです。『BigQuery』は、サービス起動中のみに料金が発生する仕組みになっている点は、コストパフォーマンスに優れた課金体系と言えます。
また、データ保存に課金されるストレージ料金も安価に設定されており、データ量を事前にチェックすれば事前におおまかなコストが把握可能です。
『BigQuery』の注意点
『BigQuery』は、メリットが多い反面、利用に関しては注意すべき点もあります。操作性に優れた『BigQuery』ですが、最初はSQL記述やエラー対策に対する習熟度が必要なことから、問題なく使用できるようになるには一定以上の時間が不可欠です。
また、事前に適正な設定がされていないと、想定以上のコストが発生するケースもあります。『BigQuery』の特徴であるコストパフォーマンスの良さを実現するには「クエリ対象データの限定」「データ圧縮」「テーブル分割」「課金データの上限設定」「キャッシュの有効利用」などが必要です。
『BigQuery』の利用料金
『BigQuery』の料金体系は「ストレージ料金」と「分析料金」の2つのカテゴリーに区分されて課金される仕組みです。これが、『BigQuery』のコストパフォーマンスが良いとされる要因でもあります。ここでは、両者の内容について解説しましょう。
ストレージ料金
『BigQuery』のストレージ料金は、以下の表のとおりです。
(2023年2月末時点、1ドル=135円で算出)
オペレーション項目 | 料金 | 摘要 |
---|---|---|
ストレージ料金 | ||
アクティブストレージ | 1GBあたり約2.7円 | 毎月、10GB以内は無料 |
長期保存 | 1GBあたり約1.35円 | 毎月、10GB以内は無料 |
データ抽出料金 | ||
ストリーミングの読取り | 1TBあたり約148.5円 | 米国リージョンのみ |
データ挿入料金 | ||
ストリーミング挿入 | 200MBあたり約1.35円 | 最小1KBで各行計算 |
分析料金
『BigQuery』の分析料金は、以下の表のとおりです。
(2023年2月末時点、1ドル=135円で算出)
オペレーション項目 | 料金 | 摘要 |
---|---|---|
分析料金 | ||
オンデマンド分析 | 1TBあたり約675円 | 毎月、1TB以内は無料 |
月度の定額 | 月額100スロットあたり約27万円 | 追加購入は100スロット単位 |
年度の定額 | 月額100スロットあたり約23万円 | 追加購入は100スロット単位 |
『RedShift』や『SQL Data Warehouse』との違い
Googleと同じく大手IT企業のMicrosoftとAmazonも、Cloud上のデータマネジメントサービスを提供しています。そこで、Microsoft Azure の『SQL Data Warehouse』およびAmazonの『RedShift』と『BigQuery』の相違点について解説しましょう。
『SQL Data Warehouse』および『RedShift』が、『BigQuery』と大きく異なるのは課金のシステムです。『BigQuery』には、両者のようにリソース占有による時間ごとの課金やインスタンスによる料金設定が存在しません。
『BigQuery』はリソースを占有せずユーザー同士でのリソース共有という仕組みであり、利用した分のみの課金となっています。コスト面は利用方法によって違いが出てくることから、『BigQuery』のみが両者よりもコストパフォーマンスに秀でているとは一概には断定できません。
しかし、『BigQuery』は大容量のデータを短時間・低コストで処理する点では、優れたデータウェアハウスであると言えるでしょう。
『BigQuery』2つの活用法
『BigQuery』には、いくつもの活用法があります。その中でも、ユーザーにとって特にメリットが大きいとされる2つの活用法を以下に紹介します。
1.BIツールによるデータの可視化
『BigQuery』には作業するデータを可視化できるBIツールが搭載されています。BIツールを利用することで、ビジュアライズされたデータをすぐに視認でき、 ビジネスに有益なデータを容易に発見できて便利です。
また『BigQuery』は、「データポータル」や「Tableau」など他のBIツールとの連携も可能なため、データソースとしての利用が容易です。『BigQuery』の特性である高速処理能力によって、ダッシュボードの再描画が早く作業できる利点もあります。
2.DMPでの一元管理
一度に大容量のデータを分析し保存できる『BigQuery』は、この特性を生かしてデータを一元管理するプラットフォームである「DMP」として活用することが可能です。自社の広告配信用データや顧客管理用のCRMデータをDMPで一元管理し、データを適宜分析することで次の作業が効率的に最適化されます。
また『BigQuery』をDMPとして一元管理すれば、必要なデータを低価格に抽出できるだけでなく、高速で分析結果を抽出可能です。さらにデータベースへの指示を行うSQLによるデータ解析も短時間で行えるなど多くのメリットがもたらされます。
なお、自社サイトの計測がGoogleアナリティクスにより実行されているケースでは、有料版の「Googleアナリティクス360」の利用により、簡易的な設定で『BigQuery』へのエクスポートが可能です。
まとめ:『BigQuery』の高速処理機能をビジネスに活用しよう
日進月歩で進化を続けているITツールの中でも、Googleが提供する『BigQuery』は、格別に便利で利用しやすくコストパフォーマンスに優れたデータウェアハウスと言って良いでしょう。特に大容量のデータを取り扱う企業にとっては、時間の短縮と効率的な作業が比較的安価なコストで実現できる点が大きな魅力です。
本記事を参考に『BigQuery』をビジネスに生かしていきましょう。