Google の超高速なデータウェアハウス「BigQuery」とは？

2016.03.12

1 そもそも BigQuery って？
2 BigQuery が高速な仕組み
- 2.1 カラム構造データストア
- 2.2 ツリーアーキテクチャ
3 気になる料金は？
4 まとめ
5 クラウドのプロに相談したい場合

中国オフィスの大原です。

今回は Google が提供している、フルマネージドのデータウェアハウス「BigQuery」にスポットを当てて記載します。

BigQuery | Google Cloud Platform — Google Cloud Platform

そもそも BigQuery って？

BigQuery とは、Googleが提供するビッグデータ解析サービスで、2012年の Google I/O（Googleが主催する開発者向けのイベント）で公式サービスとして発表されました。

元々は、Google 社内で利用されていた Dremel（ドレメル）というデータ解析用のシステムがあり、それを外部ユーザー向けに改良しサービス利用できるようにした・・・という歴史があります。

日本のシステムベンダーからも、ビッグデータ解析サービスやソフトウェアなど、多くのサービスが提供されていますが、BigQuery では数TB（テラバイト）もしくは数PB（ペタバイト）にも及ぶデータセットに対して、SQL に似たクエリを実行し、たった数秒・数十秒単位で処理をおこない、検索結果を返すというものです。

BigQuery が高速な仕組み

BigQuery が高速なのは、以下2つの仕組みを使っているからです。

カラム構造データストア

従来の RDBS では行単位でデータを保存しており、レコード指向（＝行指向）は、1件のレコード全体を同じストレージに配置します。

しかし、カラム指向（＝列指向）では、1件のレコードをカラムごとに分割して、別々のストレージに配置することで、「トラフィックの最小化」と「高い圧縮率」でのデータ保存が可能となり、クエリ実行時の高速データ参照を実現しています。

○ 従来の RDBS の「レコード＝行指向」
○ BigQuery の「カラム＝列指向」

※ 情報引用元：Dremel: Interactive Analysis of Web-Scale Datasets

ツリーアーキテクチャ

BigQuery ではツリー式で分散処理する構造になっています。

root server はクライアントからクエリを取得し、直下の intermediate servers を経由し、leaf servers がクエリ処理を実行することで、上記のカラム指向で配置したデータを並列処理し、そこで読み取った結果を高速に集約してクエリの結果を出しています。
(5~10億行以上というペタバイトクラスの膨大なデータでも、数秒で結果が出るという情報もあるようです)

○ カラム構造データスト
○ ツリーアーキテクチャ

※ 情報引用元：Dremel: Interactive Analysis of Web-Scale Datasets

上記2点が、BigQuery が高速である理由となります。

気になる料金は？

ただ BigQuery を活用するにしても、やはり料金は気になるところなので、簡単にまとめてみました。

BigQueryの料金体系は、2023年以降に大幅な変更があり、オンデマンド料金と容量料金の２つの要素で構成されています。今回は東京リージョンでの料金を記載しています。

● オンデマンド料金 = $7.5（TiBあたり）
・BigQuery上の各クエリ処理されたバイト数に基づいて課金
処理されるクエリデータは毎月 1 TiB まで無料です。

●容量料金 = $0.051（Standard Editionの場合）
・クエリ処理容量（スロット（仮想 CPU）単位）に対して料金が発生。
※ Editionごとに料金が変わります。

詳しくはBigQuery公式料金サイトをご覧ください。

まとめ

とにかく安いので、お試しに使ってみてはいがでしょうか？（Googleアカウントがある方なら、すぐに始めることができます）

▼ BigQuery のサービス詳細はコチラ ▼
https://cloud.google.com/bigquery/?hl=ja

クラウドのプロに相談したい場合

弊社ビヨンドでは、創業以来、マルチクラウドインテグレーター・マネージドサービスプロバイダー（MSP）として培った技術力で、AWS や GCP・Azure・Oracle Cloud など、様々なクラウドサーバーのプラットフォームを駆使した設計・構築・移行を行ってきました。

お客様が求めるシステムやアプリケーションの仕様・機能に応じて、お客様向けに最適化された、オーダーメイド型のクラウドサーバー環境をご提供いたしますので、クラウドにご興味のある方はお気軽にお問い合わせください。

● クラウド / サーバー設計・構築
● クラウド / サーバー移行・マイグレーション
● クラウド / サーバー運用保守・監視（24時間365日）

この記事がお役に立てば【いいね】のご協力をお願いいたします！

読み込み中...

この記事をかいた人

About the author

ohara

通信業界で法人向けのNWサービス・OA機器・グループウェアなどの、IT製品の導入を担当するセールスとしてキャリアをスタート。

その後、SIer系のデータセンター事業会社で、物理サーバー / ホスティングサービスのプリセールスエンジニア、SaaS型のSFA / CRM・BtoB向けのEコマースなどのカスタマーエンジニアを経て、現在のビヨンドへ入社。

現在は中国（深圳）に駐在して、中国ドラマと billbill を見るのが日課です。

所有資格：簿記二級

AWS の料金の目安になるかも！？Webサイトのデータ転送量を調べてみる PHP実行環境を色々試す！ 2016年はDockerコーデで決まり！