プロジェクトの計画書が承認された場合、具体的にデータ分析を進めるための事前準備を理解する事は、効率的に作業をするために重要かと思います。そこで今回は、 PowerBIのデータ分析計画書作成における具体的なプロセスについてご紹介していきます。
Power BIのデータ分析設計書の作成に関する主な業務
Power BIのデータ分析計画書は、主に以下のタスクを行います。
- ビジネス課題から分析課題への落とし込み
- 分析課題の詳細化
- インプット 、 データ分析方法の整理
- アウトプットの整理
- 分析設計書の作成
ビジネス課題から分析課題への落とし込みとは、どのようにデータ分析を行えばビジネスの課題解決することができるのか」を明確に説明することが重要です。
Power BIのデータ分析設計書①: 売上計画業務の自動化の実現可能性
現在 、 売上計画の立案は、業務に精通した従業員が数週間の時間をかけて翌年の売上予測を立て、計画に落とし込みます。そこで、過去の売上実績をもとに売上を予測することで、業務の自動化が図れるかをあらかじめ検証します。
Power BIのデータ分析設計書②:分析課題
分析課題:「2018年4月~2019年3月までの売上実績」をもとに、「2019年4月2020年3月の売上を予測し、「自動化するに値する予測できるかを検証します。
Power BIのデータ分析設計書③:分析課題の詳細化
例えば、先ほどの例であれば、「2018年4月~2019年3月-2019年4月~2020年3月までとされたデータとする。売上計上基準は、出荷基準とする。ただし、不良品などの商品は除くなどと決めます。このように、データの範囲や抽出方法、除外条件などを明確にする分析者によって結果が違ってくるものとなります。
Power BIのデータ分析のインプットとアウトプットの方法
Power BIのデータ分析方法を行う際の具体的な流れを検討する必要があります。
- 項目名
- データの粒度(例:年/月/週/日など)
- データの範囲(例:期間)
- データ定義(日本語による説明)
- 区分値の定義
- 数値項目の場合は単位
などなど分析者によって様々です。
取得元は、単に「社内システム」「オープンデータ」「Webサイト」などと書く事が重要です。
データ分析の課題となりうるものに気づけるよう、できるだけ具体的に記載します。データに関する注意事項も整理します。
例えば、売上計上基準、返品データに関する売上データとの紐付け方法など、データをみてもわからないような暗黙的なルールなどについて、設計書に注意事項として明記する事が望ましいでしょう。社内システムから得られるデータに関しては、「どのシステムからどのような情報を入手できるか」を整理します。その際、予定しているデータ分析には「使用しないデータ」も一緒に入手できるかを、「期間·粒度順目」の視点で整理します。
例えば、過去3年間の売上実績をもとに商品·月別の売上予測を行うケースの場合、
- 期間:過去3年より前のデータも取得するか
- 粒度:店舗別の売上実績も収集するか、日ごとの売上実績も収集するか
- 項目:売上日·商品·個数·金額以外に、購入者や配送情報も収集するかなどを決めます。
計画時点では分析に使う予定のないデータでも、後々分析に使用する可能性があるので、関連するデータはできるだけ収集することが望ましいでしょう。実際にデータ収集を行う担当者の作業時間などの負担を考慮したうえで、関連データをどこまで収集するかを決める必要があります。
個人情報を収集する場合は、消費者に対してデータ利用に関するガイドラインを提示していることを確認しましょう。もし確認していない場合は、どの情報は使用でき・できないのかを法務や弁護士などに相談すると良いでしょう。
データ分析方法について:どうやってPower BIを活用するのか
データ分析は、アルゴリズムを用いたデータ分析と可視化に分かれます。
どうやってPower BIを活用するのか:アルゴリズムを用いてデータ分析を行う場合
アルゴリズムを用いてモデルを作成する場合、アルゴリズムを利用するのかを検討します
- 対象データ:時系過去~現在のデータをもとに未来を予測:機械学習(回帰、分類),時系列分析など
- 現在のデータを分析:主成分分析、因子分析など
- モデルの解釈のしやすさわかりやすいモデル:線形回帰、決定木など
- わかりにくいモデル:SVM、ディープラーニングなどなど
- 処理時間
同じ目的のアルゴリズムが複数ある場合は、比較のために利用するアルゴリズムの候補を複数選びます。また、高度な分析手法として、複数のアルゴリズムを組み合わせることもありますが、精度が目標に達しなかった場合に使用するので、現状ではそこまで詳細なアクションを行う必要はないと言えます。
どうやってPower BIを活用するのか:可視化を行う場合
可視化を行う場合可視化を行う場合は、作成するグラフの種類、グラフを作成する目的、切り(時期、地域、商品、ユーザなど)、粒度(集計単位)、対象期間などを明確にします。
Power BIのデータをどうやって評価するのか?
評価方法についてデータ分析の成功や失敗、再実施、ビジネスへの組み込みやシステム判断などのために、評価方法と達成基準を明瞭にする必要があります。具体的な評価指標とどのような評価データを使用するのか、達成基準の具体的な数値を決定します。例えば、
評価指標は平均絶対誤差
評価は分析データのうちの20%を使用する。テスト用のデータと評価用のデータを分割し、テスト時には評価データは使用しないこととします。達成基準:1年間の月別売上予測の平均を計算し、平均絶対誤差を平均売上予測で除して10%以下となった場合に、分析結果を用いた施策を実行するなど決めます。
Power BIのデータのアウトプットについて
プロジェクトのゴールとして、何をアウトプットするのかを定義することも大切です。データ分析のアウトプットを明確にします。アレゴリズムを利用した分析を行う場合は、分析設計書、アルゴリズムの概略プログラムソース、収集データの一覧(管理場所)、分析結果、報告書などが該当します。
終わりに
Power BIのデータ分析のプロセスフローについて、今回はご紹介しました。いかがでしたでしょうか。事前にやるべき事を明瞭にする事で、データ分析設計書を効率的に作ってくださいね。
コメント