【超入門編:データ分析って何?】ほぼ社会人1年目が料理に例えて説明する
こんにちは。カレー好きの方の石川です。
記念すべき第一回目のブログ執筆です(ジョインブログ以降)。緊張してます。
学生の頃、「えー、なんかデータ分析ってかっこいい!」と思ったのも束の間、ETL?BI?DWH?検索して見かける用語を調べても、それで何がどうなるの…?状態でした。
そんな私が、「データ分析って中ではこんなことしてたのか!」と「料理」に例えることで理解できました。そこで、私のようなIT初心者でもイメージできるよう、データ分析とは何なのか・ETL/BI/DWHについて小難しい言葉は一切使わずに説明したいと思います。私の大好きなカレー作りのシーンに当てはめて、なんとなく理解していきましょう。
目次
目的
そもそも、企業がデータ分析をするのは何故でしょうか?料理をするのも、「カレーが食べたい」と思って作り始めますよね。それと同じです。
「お店の売り上げを上げたい」と思うから、販売データなどを集めて分析が始まります。そのデータに基づいて何かを決めることが、データ分析の目的となります。身近なところでは、家計簿も一つのデータ分析となります。家計簿から「食費が高すぎる」と知り食費を抑えることも、データに基づいて「食費を減らす」という選択をしたことになります。
ここでは、作るものが決まらないまま料理が始められないように、データ分析も目的を持って行う必要があるんだな~とだけ覚えておいてください。
詳しくは、公式YouTubeチャンネルのこちらの動画をぜひご覧ください →データ分析 is 何?
データ分析の流れ
「そうは言われても、結局ETLとか意味分からない!」というのが以前の私の感想でした。 ではデータ分析の流れを料理に例えて見ていきましょう。
データを集める
食材がないと料理ができないように、まずは分析するためのデータがないと始まりません。色々なところからデータを集めてきましょう。
マニアックなスパイスが普通のスーパーでは買えないように、複雑な分析をしたいときには、専門の部署などにお願いをして、必要なデータを集めなければなりません。
データを抽出
集めたデータの中から、必要な部分をだけを選んで持ってきます。販売データの中から「製品」「店舗」「時間帯」など、必要なデータを集めてきます。カレーでも「魚はいらないな、玉ねぎは必要だ」と食材を選ぶ感じです。
これがいわゆるETLのE(抽出:Extract)の部分となります。
データの変換
食材を選んだら、調理ができるように食材の下処理をしていきます。
玉ねぎは皮をむく必要がありますし、人参はそのままだと大きすぎるので小さく切っていきます。お肉に下味をつけることもあります。これと同じように、実はデータを見てみると、分析には必要ない・足りていない・適した形ではないものがたくさんあります。それを1つに合わせられるように、きれいなデータにしていきます。
ここがETLのT(変換:Transform)の部分となります。
データの格納
下処理ができたら、ついに炒めたり煮込む準備ができたのでお鍋に入れておきましょう。ここでは、データを分析する準備ができたよ~って感じでOKです。
これがETL最後のL(格納:Load)の部分です。
分析・レポートの作成
きれいにしたデータを結合して分析をしていきます。売り上げが高い時間帯のランキングのレポートなど、必要な情報を分かりやすくまとめます。これでカレーとライスも完成です。
ここでの問題点は、お鍋から直接だとカレーが食べにくいということです。このように、人が見るためにはまだちょっと見にくいレポートもあります。そこで登場するのがBIツールです。
BIツールでの分析レポート作成
BI(ビジネスインテリジェンス:Business Intelligence)ツールがしてくれるのは、料理でいう盛り付けです。
道案内するにも、「一つ目の角が右で、3M先の角を左に…」と言われるよりも地図を見てすぐに理解できるように、グラフや図など人に分かりやすい形にBIツールが変えてくれます。きれいな盛り付けの食事が美味しそうに見えるように、分かりやすいレポートはそれだけで説得力が上がります。
DWHに格納する
少しお話が前後してしまいますが、DWH(データウェアハウス:Data WareHouse)についても説明していきます。それはまさに「冷蔵庫」です。
上の画像にもあるように、切った食材やカレー、つまり変換したデータや結合したデータなど、様々な状態で保管をすることができます。DWHに貯めておくことで、分析などに必要なデータがすぐに取り出せる状態となります。
ここでのポイントは、カレーは食材には戻せないように、元のデータには戻せないということです。稀にカレーがカレーうどんにできるなど特例もありますが、基本的には用途の違うデータは他に使い回しはできないと思ってください。
分析レポートから知見を得る
さあ、盛り付けも完了してやっとカレーを味わう時がきました。これが「カレーが食べたい」という料理の目的ですね。
「お店の売り上げを上げたい」という目的を達成するために、「今どんな状況なのか」「目標のためにどんな取り組みをすればいいか」の知見を得ることがデータ分析の醍醐味となります。
- 「カレーは美味しいな。お肉の旨味も感じるな」 =「売上状況はこうなっているのか。この製品がここでは人気なのか。これは売れ行きが悪そうだな」
データ分析によって人間が判断できないデータの羅列から、人が判断できる形になります。そこで得た知見から、次の行動をデータに基づいて決めていくことができます。
- 「なんか味気ないな。塩を足してみよう」 =「情報が足りないな。客層のデータも足したら分析の精度が上がるかな」
- 「今度はカレールーじゃなくてスパイスから作ってみよう」 =「次は違う視点からの分析も行ってみよう」
さらに、今の課題点を発見し、より深い分析につなげることができます。
順番の前後や手法など様々な方法がありますが、データ分析の大まかな流れはこのようになります。
データ分析を次の行動につなげる
繰り返しになりますが、データ分析をする目的は何でしょうか? それはデータを分析するためではなく、データに基づいて何かを決めるためです。
これはデータ活用にも繋がってくる、データ分析をする中で一番大切なポイントです。
カレーを食べて味わうことで、今度はルーを変えたら美味しくなるかな?と、考えることと同じです。「売り上げを上げたい」という目的に対して、「どんな取り組みをすればいいか」をデータから見つけ次の行動につなげることが「データ活用」であり、そこで初めて「データを分析すること」の価値が生まれます。
さいごに
Webで検索をしても分からず、自分には難しそうだと躊躇してしまう人が、この記事で「やっぱりトライしてみよう!」と思うきっかけになれば幸いです。
最後まで目を通していただきありがとうございました!