[レポート]Snowflakeの新機能で実現する高度な分析 #SWTTokyo
2024.09.13
2024年9月11日~2024年9月12日に、「SNOWFLAKE WORLD TOUR TOKYO」が開催されました。
本記事はセッション「Snowflakeの新機能で実現する高度な分析」のレポートブログとなります。
登壇者
- Snowflake合同会社 セールスエンジニアリング統括本部 セールスエンジニア 若松 智子 氏
セッション内容
データプラットフォームとしての特徴
- Snowflake は豊富な機能によりデータを移動することなく様々なユースケースに対応できる点が特徴
高度な分析の定義
- セッションタイトルにある「高度な分析」についてここで定義する
- 従来は行列のデータを集計する分析を実行
- 現在は大量データや地理空間データなど取扱うデータの範囲も広がっている
- これまでは履歴データを集計し過去の傾向を見てきた
- 高度な分析では、将来予測を行いビジネス施策を打つことが重要
- 構造化データから、これからは半構造化・非構造化データのサポートも必要
- サイロ化されたデータソースではなく、Single Source of Truth として信頼できる1つのデータソースの確立が必要
- Snowflake で実行される高度な分析
高度な分析のための新機能紹介
- ASOF Join
- タイムスタンプ列で値が完全に一致しない場合でもテーブルを Join できる機能
- ASOF Join の活用事例
- パナソニック コネクト株式会社
- H3 関数のサポート
- H3 と呼ばれる、地球の表面を六角形に分割し表現する空間インデックスシステムをサポート
- 特定の位置の密度など地理空間的な比較が容易に
- H3 に関する事例
- Wolt 社
- 需要の高い地域と加盟店の高い地域を判別し、注力する地域を選定
- 地理空間的な観点からの需要供給予想に活用
- Wolt 社
- 全文検索
- アナライザーによってテキストがトークンに分割されトークンベースの検索を行える
- メールアドレスのドメイン部分のみを検索 など
- Full Text インデックスを作成しテキスト検索を実行することもできる
- クエリ実行パフォーマンスを向上させることにつながる
- アナライザーによってテキストがトークンに分割されトークンベースの検索を行える
- 全文検索の事例
- Sygnia 社
- Elasticsearch から Snowflake の全文検索機能に移行
- Sygnia 社
- Cortex LLM 関数
- Snowflake マネージドなサーバーリソースを使用し、LLM による推論を実行できる
- Snowflake からデータを持ち出す必要もない
- LLM 関数
- ML 関数
- Snowflake 内部で ML モデルによる推論が行える
- 予想:時系列予測
- 異常検知:時系列の異常検知
- 貢献度分析:興味ある指標に対する上位貢献者を見つける
- 売り上げ増加の原因調査などに使用できる
- 分類:データをカテゴリに分類
- ML 関数を使用した事例
- SpartanNash 社
- Snowflake AI & ML Studio
- 現在パブリックプレビュー
- GUI で AI や ML モデルの構築をサポート
さいごに
Snowflake で実施可能な「高度な分析」について、新機能を中心に実際の事例とあわせてご紹介いただいたセッションでした。新機能のアップデートが非常に多い中、各機能の概要とポイントを整理するのに大変参考になりました。個人的には特に ASOF Join の活用事例として99%のパフォーマンス向上というのが驚きでした。AI 関連のアップデートが目立ちますが、SQL 関連のアップデートも継続的に実施されているので引き続き追っていければと思いました。