2022.09.07

クラウドデータウェアハウスからデータクラウドへ 新機能の追加により大きく変化するSnowflakeの活用方法

Snowflake Summit 2022 レポート

データクラウドを提供するSnowflakeは、2022年6月13~16日に、米国ラスベガスで、年次カンファレンス「Snowflake Summit 2022」を開催しました。
カンファレンスでは、同社製品に対する一連の新機能が発表されました。新機能によりSnowflakeの活用方法はどのように変わるのでしょうか?
本記事では、2日目に開催されたOpening Keynoteの内容を中心に、現地でセミナーに参加した電通デジタル 白髭良が発表の内容をレポートし、Snowflakeの活用方法について解説します。

Opening Keynoteで紹介された6つの機能と改善点

Opening Keynoteでは、Frank Slootman(会長、CEO)、Benoit Dageville(共同創業者、プロダクト担当社長)、Christian Kleinerman(プロダクト担当上級副社長)から、新たな機能と改善点が6点説明されました。

1. Streamlitとの統合

2. Snowpark for Python

3. Native Application Framework

4. 既存ワークロードの継続的な改善

5. SQLによる機械学習

6. トランザクションデータの取り扱いを可能にする新ワークロード「ユニストア」


Streamlitとの統合

最初に、2022年3月にSnowflakeが買収したStreamlitとの統合機能について発表がありました。

Streamlitは、データから価値を引き出すという共通の目的を達成するために、2022年にSnowflakeファミリーにJoinしました。

Streamlitは、DataからActionを引き出すまでの課題であったさまざまなツールセットの利用をPythonのコードのみで実現できるツールで、現在OSS(Open Source Software)として提供されています。

豊富なPythonのライブラリも活用しつつ、さまざまなアプリケーションを開発できるようになります。

Streamlit In Snowflake - Sneak Peek | Demo[1]


Snowpark for Python

Snowparkは、開発者が普段扱い慣れた言語を用いて、Snowflake上での開発を支援するためのフレームワークです。SnowparkはクライアントAPIだけでなく、サーバーサイドでコードを動かすためのランタイム機能も提供します。

Snowparkを使うことで、開発者は好みのツール・開発言語で処理を記述でき、DataFrameなどの使い慣れた構造を使用してデータパイプラインを簡単に作成、デバッグ、そしてサードパーティのライブラリを導入できます。また、記述したコードは別途ランタイムを用意する必要はなく、Snowflake上に提供されるセキュアなランタイム環境で、直接実行できます。

これまでもJava版やScala版は利用可能でした。今回のSummitで、それらに続いてPython版がパブリックプレビューとなった、ということになります。

DEMO: Python On Snowflake | Snowpark[2]


Native Application Frameworkの登場

Native Application Framework により、UDFやストアドプロシージャ、タスクやストリームいったSnowflakeのオブジェクトを活用したアプリを作成し、セキュアデータシェアリング機能を介して、共有できるようになりました。

これにより、開発者はアプリを作成し、Snowflake マーケットプレイスで販売することでマネタイズが可能になり、利用者側はSnowflake マーケットプレイスで販売されているアプリをインストールし、利用者側のSnowflakeアカウント上で活用することができるようになります。


既存ワークロードの継続的な改善

Snowflakeの既存ワークロードの改善も発表されました。改善に関するポイントは以下の4点です。

1. AWSにおける平均 10% 高速なコンピューティング処理

2. 高速化書き込み負荷の高いワークロードの場合、パフォーマンスを平均 10% 改善

3. プライベートプレビュー中のAWSとプライベートプレビューでAzureに5XLおよび6XLデータウェアハウスを導入

4. 検索最適化サービスにより、地図上での検索を 5 倍速く改善


SQLによる機械学習

Snowflake内にビルトインされた機能を用いて、SQLによる-機械学習を実現するSQL MLと呼ばれる新機能の導入予定についての発表も行われました。詳細は発表されませんでしたが、時系列予測から対応予定になるそうです。


トランザクションデータの取り扱いを可能にする新ワークロード「ユニストア」

ユニストアとは、OLTP(オンライントランザクション処理)とOLAP(オンライン分析処理)の双方に対応しデータを1箇所におくことができる新しいワークロードの名称です。

ユニストアを実現するため、Snowflakeは今回Hybrid Tableという機能をアナウンスしました。

Snowflakeはデータウェアハウスとして誕生し、OLAPが主な用途であったため、MySQLやPostgreSQLなどが得意としていたOLTPに使うことはできませんでした。そのため、OLTPのデータをSnowflake上で分析できるようにするには、ETLツールやステージを用いた定期的なロードや、Change Data Captureなどを用いたほぼリアルタイムなデータ同期のパイプラインを構築する必要がありました。

ユニストアへの対応でパイプラインの構築が不要になり、トランザクションデータに対するリアルタイムなデータ分析も可能になります。


Snowflakeの活用方法はこう変わる

データウェアハウスとして開発されたSnowflakeは、これまで分析基盤として活用される機会が多かった製品です。

これまでのSnowflakeの主な活用方法
Zoom

今回リリースされたHybrid Tableを活用することで、会員データや商品データ、取引データなどのトランザクションデータの取り扱いをすることが可能になりました。

これからのSnowflakeの活用方法
Zoom

これによって、分析基盤と顧客データ基盤といった2つの基盤を1つのプラットフォームで運用する未来が見えてきました。つまりSnowflakeはクラウドデータウェアハウスからデータクラウドへとさらに進化したと言えます。

Hybrid Tableは現在プライベートプレビューの段階ですが、将来的に一般提供が開始されると、1つのプラットフォームでさまざまなデータが運用可能になり、事業会社はマーケティングプラットフォームのライセンス費用や運用コストをさらに削減するようなことが実現できるかもしれません。

DXを推進している企業が自社のユーザーに「パーソナライズされた顧客体験を提供する」という目標を掲げられているケースは多いと思います。

パーソナライズされた顧客体験が実現できれば、ユーザーが必要としている情報やサービスが最適なタイミング、最適なチャネルで提供することが可能になります。

ただし、このパーソナライズされた顧客体験の実現には、高速で大量の分析処理を低コストで実現可能な柔軟なコンピュータリソースや、さまざまなシステム、アプリケーションからの大量アクセスに耐えられる同時実行性能が必要になります。

Snowflakeを採用した企業はこれらの課題を解消できるプラットフォームを利用して、DXを推進していくことが可能になります。


最後に

電通デジタルでは、Snowflakeの導入、活用、運用に必要なあらゆるソリューションをご用意しています[3]。データ戦略策定から、Snowflakeを活用したデータ分析環境の構築、活用・運用まで、ワンストップで支援することが可能です。マーケティングにおけるデータ活用に課題を感じている担当者の方は、お気軽に電通デジタルまでお声がけください。


●脚注(出典)

1. ^ "Streamlit In Snowflake - Sneak Peek | Demo". YouTube.(2022年6月15日)2022年7月26日閲覧。

2. ^ "DEMO: Python On Snowflake | Snowpark". YouTube.(2021年11月16日)2022年7月26日閲覧。

3. ^ "Snowflake導入・活用コンサル・運用支援". 電通デジタル.2022年7月26日閲覧。

PROFILE

プロフィール

この記事・サービスに関するお問い合わせはこちらから

EVENT & SEMINAR

イベント&セミナー

ご案内

FOR MORE INFO

資料ダウンロード

電通デジタルが提供するホワイトペーパーや調査資料をダウンロードいただけます

メールマガジン登録

電通デジタルのセミナー開催情報、最新ソリューション情報をお届けします

お問い合わせ

電通デジタルへの各種お問い合わせはこちらからどうぞ