Power BIのデータ分析の進め方はどのようにやるのが効果的なのか?

今回はPower BIを活用したデータ分析のプロジェクトをどのように始めればいいのかのポイントをご紹介します。前提として、データ分析のプロセスを考えることが大切です。

Power BIを活用したデータ分析について:参照分析フロー

データ分析にはビジネス上の課題や問題などを発見して、データ処理、分析、施策の実施など、幅広いタスクを行わなければなりません。そこで、大切なのが、データ分析のためのロードマップを事前に作成して、ロードマップに沿って計画を実施していくことです。プロジェクトが開始される前にプロセスフローを作っておけば、万が一課題に直面したり、うまくいかない時にどこまで振り返ればいいのかなど、再検討が行いやすいかと思います。また、事前の工程との祖語などのちのプロジェクトの修正にも効果的かと言えます。

これらを1から体系的に考えるのは、非効率的なので事前にプロジェクトマネジメントの体系的なアプローチを学習しておくと良いでしょう。代表的な例として、PMBOKが挙げられます。データ分析などの体系的なアプローチ方法が整理されて記載されているのでプロジェクトを推進しなければならない担当者は事前学習をしておくと良いかと思います。

データ分析に関するフレームワークは幾つかあります。CRISP-DMやKDDなどが代表的です。

例えば、CRISP-DMは、データマイニングの業界間標準プロセスのことです。データマイニングの専門家が使用する一般的なアプローチを説明するオープンな標準プロセスモデルを指し、最も広く使用されている分析モデルと言えます。

Power BIを活用したデータ分析について②:CRISP-DMについて

「CRISP-DM usa」の画像検索結果

フェーズ1:ビジネスの状況の把握

フェーズ2:データの理解

フェーズ3:データの準備

フェーズ4:モデル作成

フェーズ5:評価

フェーズ6:展開/共有

上記の6のプロセスがあります。

Power BIのデータ分析・フェーズ1:ビジネスの状況の把握とは?

企業内の状況を把握し、課題を明確にして、プロジェクト全体を計画します。ビジネスの状況把握とは、売上や利益の低下、解約率の増加など、何か問題が顕在化されていて、その問題の中でビジネス目標として改善するべきものになります。状況把握のために課題や問題点を抽出し、課題を改善するために、(1)なぜ起こっているのか、(2)どのように改善するべきか、(3)そのために実現できるアクションは何かという仮説を考えます。また、アクションを考える際には、KGI/KPIとなる指標と計測方法をマッケーターや経営層と検討します。

Power BIのデータ分析・フェーズ2:データの理解

フェーズ①で策定したビジネス課題を解決するために必要なデータを集めます。そのデータが、実施したい分析をするために十分であるかどうかを整理します。そして、どのようなデータが入手できるのか、あるいは入手できないのかを整理します。基礎統計量、外れ値や欠損値の有無、データの分布、相関関係などを用いて確認する必要があります。

Power BIのデータ分析・フェーズ3:データの準備

データを集めてもうまくいくことは稀です。なぜなら、データを分析に適するように加工しなければならないからです。多くの場合、入手できる生のデータは非常に汚く、そのまま利用できることはほとんどないと思われます。これらは「データクレンジング」とも呼ばれます。フォーマット変換、カテゴリ変数のダミー変数化、数値の正規化などなどの処理が含まれます。
優れたアルゴリズムを使っても、データを適切に整形・加工することなく精度を向上させることはできません。このデータの準備に多くの時間を割く必要が出てくることでしょう。

Power BIのデータ分析・フェーズ4:モデル作成

フェーズ①で決めた仮説に基づいて、課題を解決するための数学的なモデル(数理モデル)を構築します。あらゆる問題で性能の良い、万能な学習アルゴリズムは存在しません。すなわち、目的に適したアルゴリズムを選択する必要が出てきます。例えば、多変量解析や機械学習の手法などを用いたモデルを作成します。通常、目的ごとに複数のモデルを作成し、あらかじめ定めた指標をもとにどのモデルを利用するのかを評価結果から決定します。

Power BIのデータ分析・フェーズ5:評価

フェーズ4で作成したモデルが、企業の目標を達成するために適切に動作するかの観点から評価します。そのために、まず相対評価を行います。そして、予測精度をもとに相対評価を行います。次に、相対評価の結果、予測精度が高かったモデルをもとに、未知データを使用した予測を行います。予測結果を絶対評価するといった一連の流れがあるのです。

Power BIのデータ分析・フェーズ6:展開/共有

分析の結果を報告・共有し、ビジネスに適用するために具体的な計画を考え実践します。ビジネスの報告内容をもとに、妥当性があるのかどうか判断し、問題なければ具体的なアクションを実施していきます。
実際のデータ分析では、最初に立てた仮説を検証することに固執して分析を行う方が多いのですが、柔軟に考える必要があります。仮説は仮説であり、間違っていた場合には素直に認め・修正が必要です。また、分析で思ったような結果が出ない場合は、このプロセスも柔軟に考え、どこまでが問題なのか特定し、戻ってやり直しをするのか検討する必要があります。

Power BIの分析・終わりに

いかがでしたか。フレームワークを理解することでPower BIの開発もよりスムーズかつ効果的になるのではないでしょうか。是非実践の現場でも抜け漏れないかチェックしてみてはいかがでしょうか。

関連記事

この記事へのコメントはありません。