【初心者向け】Tableau Prepの結合方法を徹底解説|種類・やり方・エラー解決まで完全ガイド

データ分析を始める際、こんな経験はありませんか?

  • 売上データと顧客データを組み合わせて分析したい

  • 商品マスタと販売データを照合したい

  • 部署ごとのKPIを組み合わせてダッシュボード化したい

このような**「異なるデータをひとつにまとめる作業」を、Tableau Prepでは「結合(ジョイン)」と呼びます。


Tableau Prepにおける「結合」とは?

✔️ 定義

**「共通の項目(キー)を基に、2つ以上のデータセットを1つにまとめる操作」**のこと。

たとえば:

  • 顧客ID

  • 商品コード

  • 店舗名
    などの共通する項目をキーにして結合します。


Tableau Prepの結合の種類

Tableau Prepでは、以下の3種類の結合が使えます。

結合の種類 説明 使用例
内部結合 両方のデータに共通するデータのみ残す 顧客データと売上データに存在する顧客のみ
左結合 左側のデータはすべて残し、右は一致するものだけ 全店舗リストに対して、売上がある店舗の売上を追加
右結合 右側のデータはすべて残し、左は一致するものだけ 売上データに、存在する店舗情報を追加
完全外部結合 両方の全データ。存在しない部分はNULLで補完 売上のない店舗や、店舗のない売上も全て含む

Tableau Prepでの結合の操作手順

✅ 基本ステップ

  1. データの読み込み
    → Excel、CSV、SQLなど複数のデータソースを読み込む。

  2. 「結合」ステップを追加
    → フロー画面で2つのデータ接続元をドラッグ&ドロップして重ねる。

  3. 結合条件(キー)の設定
    → 例:「顧客ID=顧客ID」「店舗名=店舗名」

  4. 結合の種類を選択
    → 内部結合、左結合、右結合、完全外部結合のいずれか。

  5. 結合の結果を確認
    → 一致した行、不一致の行が色分け表示される。データ品質が視覚的に確認可能。

  6. 次のステップへ(クリーニング・フィルターなど)


✔️ 結合画面のインターフェース解説

  • 左側:データソースAのフィールド

  • 右側:データソースBのフィールド

  • 中央:結合キー(フィールドをドラッグしてリンク)

  • 下部:結合のプレビュー(一致/不一致の件数が色で表示)

「どこでデータがマッチしているか」「どれが漏れているか」が一目瞭然。


結合時によくある注意点

■ フィールド名が異なる

→ フィールド名が異なっていても、手動でマッチング可能。
例:「Store_ID」と「店舗ID」でもOK。


■ データ型の不一致

  • 例:「文字列」と「整数」など。
    → Tableau Prepでは、「クリーニングステップ」でデータ型の変換が可能。


■ 空白やNULLの扱い

  • 一方のデータに存在しないキーはNULLとして結合。
    → 完全外部結合の場合は、NULLが多く発生するので注意。

Tableau Prepの結合|活用事例

■ ケース①:売上データと顧客マスタの統合

  • 複数の店舗から送られてくる売上データ(CSV)と、顧客情報(Excel)を結合。

  • **「顧客ID」**をキーに内部結合。
    → 購買履歴から、地域別・年齢別の売上分析が可能に。


■ ケース②:商品マスタと販売実績の結合

  • 販売データには商品コードのみ記載。

  • 商品マスタから**「商品名」「カテゴリ」**を結合。
    → ダッシュボードに、わかりやすい商品名での分析が可能。


■ ケース③:人事データと給与データの結合

  • 人事部が持つ従業員情報と、経理が持つ給与支払いデータ。

  • 従業員IDをキーに結合。
    → 月別の労働コスト、部門別の給与分析が自動化。


よくある結合エラーと解決策

✔️ エラー①:一致しないデータが多い

  • 原因:

    • キーとなるフィールドのスペルミス

    • 前後の空白(スペース)

    • 全角/半角の違い

  • 解決:

    • クリーニングステップで「トリム(空白除去)」を適用。

    • 文字列の統一(大文字/小文字の変換)。

    • 手動でマッチングのフィールドを再設定。


✔️ エラー②:結合後にNULLが大量発生

  • 原因: 左右のデータに一致しないキーが多い。

  • 解決:

    • 結合画面の下部に表示される「不一致の件数」を確認。

    • 不一致の理由をクリーニングで確認(例:店舗名の揺れ)。

    • 必要に応じて結合の種類を変更(内部→完全外部結合)。


✔️ エラー③:データ型の不一致

  • 原因: 片方が「数値」、もう片方が「文字列」など。

  • 解決:

    • 「クリーニング」→「データ型の変換」で統一。

    • 数字型→文字列変換は簡単に可能。


効率的な結合のベストプラクティス

■ 1. 結合前にクリーニングを必ず実行

  • 不要な列の削除

  • 空白・表記揺れの修正

  • データ型の統一

→ これだけで結合精度が大幅にアップ。


■ 2. 結合後の「不一致」の確認を習慣化

  • Tableau Prepの強力な特徴は、不一致データが色で視覚的に見えること。

  • → 不一致が多い場合は、原因をその場で探って修正。


■ 3. フローの保存と再利用

  • 結合ルールは一度作れば、フローとして何度でも再利用可能。

  • 毎月のデータ更新も「ファイル差し替え→フロー実行」で完了。


■ 4. 複雑な結合は段階的に設計

  • 3つ以上のデータを結合する場合、**「二つずつ段階的に結合」**するのが安定する。
    → ミスの発生を最小限にできる。


まとめ|Tableau Prepの結合は“データ分析の土台”

  • Tableau Prepの結合は、直感的で視覚的な操作が可能。

  • 内部結合・左結合・右結合・完全外部結合を柔軟に使い分けることで、多様な分析が可能。

  • エラーや不一致もリアルタイムに確認でき、その場で修正できる。

  • 結合の正確さは、分析の質を決定する最も重要な工程のひとつ。

関連記事

この記事へのコメントはありません。

カテゴリー

アーカイブ