🎯 Power BIを本格的に学びたい方へ
初心者から上級者まで、あなたのレベルに合わせたソリューションをご用意
ハンズオンセミナー
基礎編
Power BIの基礎を1日でマスター。データ取り込みから可視化まで実践形式で学べます。
- データ取り込みの基本
- レポート作成の流れ
- 基本的なビジュアル作成
Power BI 導入支援・構築
コンサルティング
経験豊富なコンサルタントが、御社の課題に合わせたPower BI導入を全面サポート。
- 大手から中小まで30社以上の導入実績
- 延べ3,000名以上のセミナー開催実績
- 課題ヒアリングから運用定着まで伴走
Power BI で「平均ではなく中央値で見たい」という要望は、実務ではかなり多いです。理由はシンプルで、平均は極端な値(外れ値)の影響を強く受けるからです。たとえば、案件単価、処理時間、残業時間、購入点数、問い合わせ対応時間、配送リードタイムなどは、少数の極端な値が混ざるだけで平均が簡単に跳ねます。その結果、現場の体感と数字がズレてしまいます。
中央値は、真ん中の値を見る指標なので、外れ値の影響を受けにくく、現場の実感に近い傾向をつかみやすいです。ただし、Power BI で中央値を出すときに一番ハマるのは「何の中央値なのか」という粒度の問題です。ここを曖昧にしたままメジャーを作ると、見たい中央値と違う値になったり、スライサーの選び方で結果が大きく変わってしまったりします。
この記事では、power bi 中央値を正しく出すために、設計の考え方と DAX の作り方を、実務のパターン別にまとめます。中央値そのものの説明ではなく、「Power BI で正しく運用できる形」に落とすことに集中します。
中央値が必要になる典型シーン
まず、中央値が役立つ場面を具体的に整理します。ここが明確になると、粒度が決まりやすくなります。
-
案件単価の中央値(高額案件が少数混ざると平均が歪む)
-
受注までの日数の中央値(長期案件が少数混ざると平均が歪む)
-
問い合わせ対応時間の中央値(極端に長いケースが混ざる)
-
配送リードタイムの中央値(遅延が混ざる)
-
勤怠の残業時間の中央値(特定の人だけ極端に多い)
-
工数の中央値(例外対応が混ざる)
-
顧客あたり購入回数の中央値(ヘビーユーザーが平均を押し上げる)
-
取引あたり購入点数の中央値(まとめ買いが平均を押し上げる)
どれも「分布が歪みやすい」データです。中央値が欲しいのは、まさにこのタイプの指標です。
まず決めるべきことは「中央値の対象(粒度)」
power bi 中央値の相談で最も多い失敗は、中央値の対象が曖昧なまま作ってしまうことです。次の2つは似ているようで、意味が全く違います。
-
取引明細行の金額の中央値
明細行(商品×注文など)の金額の真ん中です。 -
注文(取引)単位の合計金額の中央値
注文ごとに合計した金額を並べて、その真ん中です。
現場が言う「案件単価の中央値」は、だいたい後者(案件単位の合計金額)のことが多いです。でもデータは明細行になっていて、そこにそのまま中央値をかけると「明細の中央値」になってしまいます。これがズレの原因になります。
だから、最初に次を決めます。
・何を1件と数えるのか(案件、注文、顧客、日、月、担当者など)
・その1件あたりの値はどう定義するのか(合計、平均、最大、期間など)
ここが決まれば、DAX は素直になります。
Power BI で中央値を出す基本パターン
中央値は、DAX では基本的に PERCENTILE を使うのが定石です。0.5 を指定すると中央値になります。重要なのは「どの列の」「どの集合に対して」計算するかです。
パターンA:テーブルの数値列そのものの中央値(単純)
例えば、テーブルに「処理時間(分)」があり、その列の中央値を見たい場合です。
これは分かりやすいですが、対象が明細行になります。案件単位、顧客単位などにしたい場合は、このままでは足りません。
パターンB:グループ単位の値を作って、その中央値を取る(実務で最頻出)
例:注文単位の合計金額の中央値を出したい
手順はこうです。
-
注文ごとに合計金額を作る
-
その合計金額の中央値を取る
DAX のイメージとしては、注文IDごとの集計テーブルを一時的に作って、そこから中央値を取ります。
この形にすると、「注文ごとの金額」の中央値になります。多くの実務で求められる中央値は、この “粒度を上げてから中央値” の型です。
パターンC:顧客あたり売上の中央値(顧客単位の分布)
顧客ごとの売上合計を作って、その中央値を取りたいケースです。
この中央値は「顧客分布の真ん中」を表します。平均顧客売上よりも、現場の体感に近いことが多いです。
パターンD:期間別に中央値を出したい(月別の中央値など)
月別に中央値を出したい場合、日付テーブルと正しいリレーションが前提です。軸が月で、メジャーが中央値なら、Power BI がその月のフィルターコンテキストで計算します。
ただし注意点があります。月別の中央値を出す場合、月の中に含まれる“対象集合”が何かを再確認してください。
・月の中の注文金額の中央値なのか
・月の中の顧客売上の中央値なのか
・月の中の明細金額の中央値なのか
同じ「月別中央値」でも意味が変わります。上のパターンBやCを、日付フィルターがかかった状態で計算すれば、月別の中央値として動きます。
中央値でつまずくポイント(結果が違う、遅い、空白になる)
中央値は便利ですが、実務では特有のつまずきがあります。よくある問題と対策を整理します。
1) 中央値が期待より小さい/大きい
原因の多くは「粒度違い」です。明細の中央値になっているのに、案件単価の中央値を期待している、というケースです。まず “1件の定義” を見直します。
2) 中央値がスライサーで極端に変わる
中央値は集合の真ん中なので、フィルター条件で対象集合が変われば大きく動きます。これは仕様ですが、ユーザーが誤解しやすいです。
対策としては、中央値と一緒に次の情報を出すと理解が進みます。
・対象件数(中央値の計算に含まれた件数)
・平均
・第1四分位(25%点)と第3四分位(75%点)
・最小値、最大値(外れ値の存在を示す)
中央値は単体より “分布の補助情報” とセットで出す方が誤解が減ります。
3) 中央値が空白になる
対象が0件のときは空白になります。また、数値列が空白だらけの場合も意図せず空白になります。
対策は、空白除外を明示することです。例えば、値が空白の行は除外するようにテーブルを絞ってから中央値を計算します。
4) 中央値が重い
中央値は並べ替えを伴う計算なので、データ量が大きいと重くなりやすいです。さらに、パターンBやCのように SUMMARIZE を使って粒度を上げると、計算対象が増えます。
重いときの対策は次の順番が効きます。
・対象集合を減らす(期間や条件で絞る)
・明細からではなく集計済みテーブルを用意する(注文単位や顧客単位の集計表を作る)
・不要な列をモデルから削減して圧縮を効かせる
・DirectQuery の場合は、DB側で集計済みを持つ(中央値計算はDB負荷が高いことがある)
中央値は「毎回動的に全部計算する」より、よく使う粒度の集計を準備しておくと安定します。
中央値だけでなく四分位を出すと、現場が理解しやすい
中央値を出したのに「それって良いの?悪いの?」という会話になることがあります。ここで効くのが四分位です。25%点と75%点を出せると、分布の広がりが見えます。
例:注文金額の四分位
中央値と四分位を並べると、
・中央値はどこか
・下位25%はどの程度か
・上位25%はどの程度か
が見えるので、外れ値だけで平均が引っ張られている状況や、ばらつきの大きさが一目で分かります。
現場向けのKPIでは、中央値+四分位のセットはかなり強いです。
“中央値を使うべき”場面と“平均でよい”場面
中央値は万能ではありません。目的によっては平均の方が正しいこともあります。
中央値が向く
・現場の体感に近い代表値が欲しい
・外れ値が混ざる指標
・作業時間、リードタイム、単価など分布が歪むもの
・「典型的にはどれくらい?」を知りたい
平均が向く
・総量や期待値に近い指標が欲しい
・コストや売上の見込みなど、全体の重みを反映したい
・外れ値も含めた平均的な負担を見たい
実務では「中央値と平均を並べる」だけで会話が進むことが多いです。平均との差が大きいほど、分布が歪んでいるサインになります。
可視化のコツ:中央値は“線”より“分布”と相性が良い
中央値は折れ線でも見せられますが、より相性が良いのは分布系の見せ方です。
・中央値と四分位をカードで出す
・カテゴリ別に中央値を棒で比較する
・箱ひげ図のような分布表現を使う(可能なら)
・散布図で分布を見て、代表値として中央値を添える
特に、部門別や拠点別の「処理時間中央値」を比較すると、平均よりも公平に比較できることが多いです。外れ値対応に引っ張られにくいからです。
運用で壊れないための作り方
最後に、中央値をレポートに入れて運用する場合に、壊れないための工夫をまとめます。
・“1件の定義”を明文化する
注文単位なのか、明細単位なのか、顧客単位なのか。ここが曖昧だと説明が難しくなります。
・対象件数を必ず併記する
中央値は対象件数が少ないと不安定になります。件数が見えれば、判断がしやすくなります。
・中央値だけでなく四分位も併記する
分布の理解が進み、誤解が減ります。
・よく使う粒度は集計済みテーブルで支える
重さと安定性の両方に効きます。
・日付テーブルと関係を整える
期間別の中央値を出すなら、日付が正しく効く状態が前提です。
まとめ
power bi 中央値は、外れ値の影響を受けにくく、現場の体感に近い代表値として非常に有効です。ただし、Power BI で中央値を正しく出す鍵は「粒度」です。明細の中央値なのか、注文単位の中央値なのか、顧客単位の中央値なのか。ここを決めてから、PERCENTILEX を使って計算するのが最短ルートです。
さらに、中央値は単体よりも、対象件数や四分位とセットで出すと誤解が減り、意思決定に使いやすくなります。重さが気になる場合は、よく使う粒度を集計済みテーブルで支える。これで、中央値を “便利な数字” から “運用できる指標” にできます。
もし困り事があるなら、まずは無料相談を
「DAX 関数が多すぎてどれを使えばいいか分からない」「複雑なロジックを組みたいけれど、エラーが出て解決できない」「会社全体で DAX を学習したい」など、Power BI やデータ活用でお悩みの方はぜひお気軽にご相談ください。
もし困り事があるなら、まずは無料相談はこちら
コンサルサービスの詳細や成功事例なども合わせてご紹介いたします。
社内にデータ活用のノウハウや専門人材が十分いない場合でも、弊社が伴走しながら最短ルートで成果を出せるようサポートいたします。
セミナーで学ぶ!DAX 関数の実践スキル
📊 Power BIでより効率的なレポート作成を!
Power BIハンズオンセミナー初級編では、短時間でデータモデリングのノウハウを学び、ビジネスに活かせるレポート作成を実践形式で習得できます。
少人数制のため、定員になり次第締切!
👉 セミナー詳細を今すぐチェック
📈 Power BIスキルを次のレベルへ!
DAX 関数 × データモデル設計 で、複雑なデータ分析やレポート作成もスムーズに!
Power BIハンズオンセミナー中級編 なら、実践形式で学べるから即戦力に。
業務効率をアップし、社内での評価を高めるチャンス!
今こそスキルアップのタイミング!
👉 詳細はこちら
DAX を使いこなすことで、Power BI の真価を最大限に引き出し、より高度な分析をスムーズに進められます。実践的な知識を身につけて、組織のデータドリブンな文化をリードしましょう。
コメント