データ分析を始める際、こんな経験はありませんか?
-
売上データと顧客データを組み合わせて分析したい
-
商品マスタと販売データを照合したい
-
部署ごとのKPIを組み合わせてダッシュボード化したい
このような**「異なるデータをひとつにまとめる作業」を、Tableau Prepでは「結合(ジョイン)」と呼びます。
Tableau Prepにおける「結合」とは?
✔️ 定義
**「共通の項目(キー)を基に、2つ以上のデータセットを1つにまとめる操作」**のこと。
たとえば:
-
顧客ID
-
商品コード
-
店舗名
などの共通する項目をキーにして結合します。
Tableau Prepの結合の種類
Tableau Prepでは、以下の3種類の結合が使えます。
結合の種類 | 説明 | 使用例 |
---|---|---|
内部結合 | 両方のデータに共通するデータのみ残す | 顧客データと売上データに存在する顧客のみ |
左結合 | 左側のデータはすべて残し、右は一致するものだけ | 全店舗リストに対して、売上がある店舗の売上を追加 |
右結合 | 右側のデータはすべて残し、左は一致するものだけ | 売上データに、存在する店舗情報を追加 |
完全外部結合 | 両方の全データ。存在しない部分はNULLで補完 | 売上のない店舗や、店舗のない売上も全て含む |
Tableau Prepでの結合の操作手順
✅ 基本ステップ
-
データの読み込み
→ Excel、CSV、SQLなど複数のデータソースを読み込む。 -
「結合」ステップを追加
→ フロー画面で2つのデータ接続元をドラッグ&ドロップして重ねる。 -
結合条件(キー)の設定
→ 例:「顧客ID=顧客ID」「店舗名=店舗名」 -
結合の種類を選択
→ 内部結合、左結合、右結合、完全外部結合のいずれか。 -
結合の結果を確認
→ 一致した行、不一致の行が色分け表示される。データ品質が視覚的に確認可能。 -
次のステップへ(クリーニング・フィルターなど)
✔️ 結合画面のインターフェース解説
-
左側:データソースAのフィールド
-
右側:データソースBのフィールド
-
中央:結合キー(フィールドをドラッグしてリンク)
-
下部:結合のプレビュー(一致/不一致の件数が色で表示)
→ 「どこでデータがマッチしているか」「どれが漏れているか」が一目瞭然。
結合時によくある注意点
■ フィールド名が異なる
→ フィールド名が異なっていても、手動でマッチング可能。
例:「Store_ID」と「店舗ID」でもOK。
■ データ型の不一致
-
例:「文字列」と「整数」など。
→ Tableau Prepでは、「クリーニングステップ」でデータ型の変換が可能。
■ 空白やNULLの扱い
-
一方のデータに存在しないキーはNULLとして結合。
→ 完全外部結合の場合は、NULLが多く発生するので注意。
Tableau Prepの結合|活用事例
■ ケース①:売上データと顧客マスタの統合
-
複数の店舗から送られてくる売上データ(CSV)と、顧客情報(Excel)を結合。
-
**「顧客ID」**をキーに内部結合。
→ 購買履歴から、地域別・年齢別の売上分析が可能に。
■ ケース②:商品マスタと販売実績の結合
-
販売データには商品コードのみ記載。
-
商品マスタから**「商品名」「カテゴリ」**を結合。
→ ダッシュボードに、わかりやすい商品名での分析が可能。
■ ケース③:人事データと給与データの結合
-
人事部が持つ従業員情報と、経理が持つ給与支払いデータ。
-
従業員IDをキーに結合。
→ 月別の労働コスト、部門別の給与分析が自動化。
よくある結合エラーと解決策
✔️ エラー①:一致しないデータが多い
-
原因:
-
キーとなるフィールドのスペルミス
-
前後の空白(スペース)
-
全角/半角の違い
-
-
解決:
-
クリーニングステップで「トリム(空白除去)」を適用。
-
文字列の統一(大文字/小文字の変換)。
-
手動でマッチングのフィールドを再設定。
-
✔️ エラー②:結合後にNULLが大量発生
-
原因: 左右のデータに一致しないキーが多い。
-
解決:
-
結合画面の下部に表示される「不一致の件数」を確認。
-
不一致の理由をクリーニングで確認(例:店舗名の揺れ)。
-
必要に応じて結合の種類を変更(内部→完全外部結合)。
-
✔️ エラー③:データ型の不一致
-
原因: 片方が「数値」、もう片方が「文字列」など。
-
解決:
-
「クリーニング」→「データ型の変換」で統一。
-
数字型→文字列変換は簡単に可能。
-
効率的な結合のベストプラクティス
■ 1. 結合前にクリーニングを必ず実行
-
不要な列の削除
-
空白・表記揺れの修正
-
データ型の統一
→ これだけで結合精度が大幅にアップ。
■ 2. 結合後の「不一致」の確認を習慣化
-
Tableau Prepの強力な特徴は、不一致データが色で視覚的に見えること。
-
→ 不一致が多い場合は、原因をその場で探って修正。
■ 3. フローの保存と再利用
-
結合ルールは一度作れば、フローとして何度でも再利用可能。
-
毎月のデータ更新も「ファイル差し替え→フロー実行」で完了。
■ 4. 複雑な結合は段階的に設計
-
3つ以上のデータを結合する場合、**「二つずつ段階的に結合」**するのが安定する。
→ ミスの発生を最小限にできる。
まとめ|Tableau Prepの結合は“データ分析の土台”
-
Tableau Prepの結合は、直感的で視覚的な操作が可能。
-
内部結合・左結合・右結合・完全外部結合を柔軟に使い分けることで、多様な分析が可能。
-
エラーや不一致もリアルタイムに確認でき、その場で修正できる。
-
結合の正確さは、分析の質を決定する最も重要な工程のひとつ。
コメント