2022年9月30日

BigQueryでデータ分析基盤構築をスモールスタートする 【基礎編】

みなさん、こんにちは。

リベルスカイでデータ活用支援を担当している磯野です。

この記事をご覧いただいている皆さまは、経営層や上司から「これからはデータドリブン経営だ!データ分析基盤を構築してくれ!」なんて言われていたり、ご自身で「自社内のデータをもっと活用すべきだ」などといった課題をお抱えではないでしょうか。

今回の記事では、BigQuery を用いた ”データ分析基盤””スモールスタート” をテーマに3部構成でご紹介します。

なぜ、スモールスタートなのか

本題に入る前に、この記事のテーマの1つである ”スモールスタート” に触れておきます。

企業には多くのデータが存在しています。「データ基盤構築」となると、非常に時間とコストがかかる印象を受ける方も多いのではないでしょうか。

ですが「データ基盤」を構築してデータを集めるだけでは、コスト削減や売上Upには繋がりません。集まったデータをいかに分析し、活用していくかが大切です。

さらにはデータ分析をもとに実際のアクションを起こすのは、営業や生産現場などのビジネスユーザです。これらビジネスユーザを巻き込み、データ活用を効率的に進めていくにはアウトプットを見せつつ、データ活用のPDCAを回していくことが非常に重要です。

まずは「データ基盤構築」を ”スモールスタート” させ、ビジネスユーザの求めるアウトプットを目指していきましょう!

BigQueryのススメ

少し前置きが長くなりました。そんな ”スモールスタート” におすすめの BigQuery です。
 
BigQuery は GCP ( Google Cloud Platform )が提供するフルマネージドのデータウェアハウスです。SQLクエリを使用して大規模データの分析などが行えます。

どんな点が良いのか、以下の3点で説明していきます。

1. 料金体系

2. サーバーレス & フルマネージド

3. ML機能

※その他BigQueryの特徴は、さまざまなところで紹介されているので本記事では割愛します。
 
  BigQuery各機能のより詳細な確認はこちらから

それでは詳細の説明です。

 1. 料金体系

今回のようなスモールスタート利用で発生するBigQueryの料金は主に下記2点です。
 
  ※その他の詳細な料金体系についてはこちらをご確認ください。

● クエリコスト

  BigQueryではクエリによりスキャンされたデータに対して料金が発生します。
 
  詳細に記載のあるとおり、毎月1TBまでの無料枠 があり、非常に強力な味方となってくれます。

  ● ストレージコスト

  BigQuery に読み込むデータを保存する費用です。ストレージコストは "アクティブ ストレージ"
 
  と”長期保存” の2つの料金パターンがあります。    

  • アクティブ ストレージ:
     
     過去 90 日間で変更されたテーブルが対象となります。

  • 長期保存:
     
     90 日間連続して変更されていないテーブルが対象となります。特に設定などは不要で、対象
     
     となるテーブルのストレージコストが自動的に約 50% OFFとなります。

  また、こちらも同様に 毎月 10 GB までの無料枠 があります。

  利用した分だけ発生する従量課金体系かつ非常に安い料金設定に加え、毎月の無料枠により "スモ
 
  ールスタート" においては、毎月のBigQuery料金は0円もしくは数円〜数百円で利用することが可
 
  能です。

 2. サーバーレス & フルマネージド

BigQueryは ”サーバーレス” のサービスです。利用を開始するにあたり、VMやストレージ、クラ
 
   スタのビルドやデプロイなどは不要です。


 
   また、データ容量に応じて自動的にスケールしてくれる ”フルマネージド” であるため、運用にお
 
けるインフラ面での負荷がかからず、将来的により大規模なデータを扱いことになっても問題あ
 
りません。

これらの特徴により、企業は ”データ分析” にのみに力を注ぐことができ、よりスピード感を持っ
 
てデータ活用にと組むことができます。

 3. ML機能

BigQueryには ”BigQuery ML” と呼ばれる機械学習モデルを作成・実行できるサービスが用意され
 
ています。


 
BigQuery MLではBigQueryからデータを移動させることなく、BigQuery同様、SQLだけで複雑な
 
機械学習の工程を実行することができるため、専門知識を必要としません。

上のグラフはBigQuery MLの時系列モデルを用いて予測した弊社HPのView数です。
 
※オレンジ色:実績値、水色:予測値

View数が少なくお恥ずかしいデータであることはさておき、休日(グラフ上の谷の部分)なども
 
考慮した予測がたった数行のクエリで実行できることは、自社のデータを最大限活用するための
 
大きな要素になるのではないでしょうか。

まとめ

BigQueryは、”サーバレス&フルマネージド” であるため、データさえあればすぐに立ち上げることができます。

また、その ”料金体系” や無料枠から非常に低コストで利用することができ、SQLによる ”ML機能” の作成まで行えることから、誰でもデータの分析をはじめることができます。

この記事では ”スモールスタート" の観点で、その特徴をご説明してきましたが、これらの特徴を踏まえて、より正確に言い表すと スモールスタートできて、大きくスケールすることができる が正しい説明となります!

如何でしたでしょうか?「データの民主化」をテーマに広く利用されているBigQueryの魅力が少しでも伝わり、皆様のデータ活用のキッカケとなれたらうれしいです。

次回の記事では、【実践編】としてBigQueryを用いたデータ分析基盤およびデータパイプラインの構築についてお伝えしたいと考えています!

さいごに

リベルスカイでは Google Cloud を中心にお客様のデータ活用・分析をご支援しています。

今回の ”スモールスタート” や "Poc" を目的とした 簡易的なデータ活用パッケージサービス もご用意しています。

まずは自社課題のお悩み相談など、些細なことでも構いません。

下記ボタンのお問合せページよりまずはお気軽にご相談ください。