【大阪 / 横浜】インフラ / サーバーサイドエンジニア募集中!

【大阪 / 横浜】インフラ / サーバーサイドエンジニア募集中!

【25卒向け】AI×バーチャル面接の募集を開始いたしました!

【25卒向け】AI×バーチャル面接の募集を開始いたしました!

【導入実績 500社以上】AWS 構築・運用保守・監視サービス

【導入実績 500社以上】AWS 構築・運用保守・監視サービス

【CentOS 後継】AlmaLinux OS サーバー構築・移行サービス

【CentOS 後継】AlmaLinux OS サーバー構築・移行サービス

【WordPress 専用】クラウドサーバー『ウェブスピード』

【WordPress 専用】クラウドサーバー『ウェブスピード』

【格安】Webサイト セキュリティ自動診断「クイックスキャナー」

【格安】Webサイト セキュリティ自動診断「クイックスキャナー」

【低コスト】Wasabi オブジェクトストレージ 構築・運用サービス

【低コスト】Wasabi オブジェクトストレージ 構築・運用サービス

【予約システム開発】EDISONE カスタマイズ開発サービス

【予約システム開発】EDISONE カスタマイズ開発サービス

【100URLの登録が0円】Webサイト監視サービス『Appmill』

【100URLの登録が0円】Webサイト監視サービス『Appmill』

【中国現地企業に対応】中国クラウド / サーバー構築・運用保守

【中国現地企業に対応】中国クラウド / サーバー構築・運用保守

【YouTube】ビヨンド公式チャンネル「びよまるチャンネル」

【YouTube】ビヨンド公式チャンネル「びよまるチャンネル」

Google の超高速なデータウェアハウス「BigQuery」とは?

技術営業部の大原です。

今回は Google が提供しているフルマネージドのデータウェアハウス「BigQuery」にスポットを当てて記載します。

BigQuery | Google Cloud Platform — Google Cloud Platform

そもそも BigQuery って?

BigQuery とは、Googleが提供するビッグデータ解析サービスで、2012年の Google I/O(Googleが主催する開発者向けのイベント)で公式サービスとして発表されました。

元々は、Google 社内で利用されていた Dremel(ドレメル)というデータ解析用のシステムがあり、それを外部ユーザー向けに改良しサービス利用できるようにした・・・という歴史があります。

日本のシステムベンダーからも、ビッグデータ解析サービスやソフトウェアなど、多くのサービスが提供されていますが、
BigQuery では数TB(テラバイト)もしくは数PB(ペタバイト)にも及ぶデータセットに対して、SQL に似たクエリを実行し、たった数秒・数十秒単位で処理をおこない、検索結果を返すというものです。


BigQuery が高速な仕組み

BigQuery が高速なのは、以下2つの仕組みを使っているからです。

カラム構造データストア

従来の RDBS では行単位でデータを保存しており、レコード指向(=行指向)は、1件のレコード全体を同じストレージに配置します。

しかし、カラム指向(=列指向)では、1件のレコードをカラムごとに分割して、別々のストレージに配置することで、「トラフィックの最小化」と「高い圧縮率」でのデータ保存が可能となり、クエリ実行時の高速データ参照を実現しています。

02_s

※ 左図 : 従来 RDBS の「レコード=行指向」
※ 右図 : BigQuery の「カラム=列指向」
画像引用元:Dremel: Interactive Analysis of Web-Scale Datasets

ツリーアーキテクチャ

BigQuery ではツリー式で分散処理する構造になっています。

root server はクライアントからクエリを取得し、直下の intermediate servers を経由し、leaf servers がクエリ処理を実行することで、上記のカラム指向で配置したデータを並列処理し、そこで読み取った結果を高速に集約してクエリの結果を出しています。

03_s
画像引用元:Dremel: Interactive Analysis of Web-Scale Datasets

  • カラム構造データストア
  • ツリーアーキテクチャ

上記2点が BigQuery が高速である理由となります。

※ また5~10億行以上というペタバイトクラスの膨大なデータでも、数秒で結果が出るという情報もあるようです。


気になる料金は?

ただ BigQuery を活用するにしても、やはり料金は気になるところなので、簡単にまとめてみました。

● ストレージ容量 = $0.020 / GB / 月
・BigQueryに保存されているデータ容量
※ データ1TBでも「$20 = 約2,000円 / 月」

● クエリによる処理容量 = $5 / TB
・クエリ実行時にスキャンされるデータ量
※ クエリによるデータ処理は「毎月1TB」までなら無料

● ストリーミングインサート  = $0.01 / 200MB
・データのリアルタイム収集で利用される API で、テーブルにインサートしたデータ量に対して課金

まとめ

とにかく安いので、お試しに使ってみてはいがでしょうか?(Googleアカウントがある方なら、すぐに始めることができます)

■ BigQuery のサービス詳細は ▼【コチラから】▼
https://cloud.google.com/bigquery/?hl=ja

この記事がお役に立てば【 いいね 】のご協力をお願いいたします!
1
読み込み中...
1 票, 平均: 1.00 / 11
2,739
X facebook はてなブックマーク pocket
【2024.6.30 CentOS サポート終了】CentOS サーバー移行ソリューション

【2024.6.30 CentOS サポート終了】CentOS サーバー移行ソリューション

【25卒向け】AI×バーチャル面接の募集を開始いたしました!

【25卒向け】AI×バーチャル面接の募集を開始いたしました!

【大阪 / 横浜】インフラエンジニア・サーバーサイドエンジニア 積極採用中!

【大阪 / 横浜】インフラエンジニア・サーバーサイドエンジニア 積極採用中!

この記事をかいた人

About the author

ohara

通信業界で法人向けのNWサービス・OA機器・グループウェアなどの、IT製品の導入を担当するセールスとしてキャリアをスタート。

その後、SIer系のデータセンター事業会社で、物理サーバー / ホスティングサービスのプリセールスエンジニア、SaaS型のSFA / CRM・BtoB向けのEコマースなどのカスタマーエンジニアを経て、現在のビヨンドへ入社。

現在は、アジアのシリコンバレー中国・深圳に駐在して、中国ハードウェアの卸販売・貿易代理店の仕事してます。

中国ドラマと billbill を見るのが日課です。

所有資格:簿記二級