Tableau Prepはデータを分析に適した形に加工するツールで、その処理過程を記録して共有したり再利用したりすることができます。
本ページでは、Tableau Prep Builderでフィールドや値を編集することによってデータをクリーニングする方法を紹介します。
クリーニングステップの開始
クリーニングする対象を決めて、フローペインから処理を開始します。
例えばスーパーストアの注文データをクリーニングする場合には、フローペインの注文テーブルアイコンの右にある「+」をクリックして、リストから「クリーニングステップ」を選択します。
するとプロファイルペインとデータグリッドが表示されるようになります。
プロファイルペインに表示されるデータの種類や分布、データグリッドに表示されるデータの中身を参照しながら、必要な処理を適用してクリーニング処理を進めていきます。
以下ではクリーニングステップで可能な処理の内容を紹介します。
フィールドの編集
フィールドの名称、タイプ、順番の変更および削除が可能です。
▼フィールド名の変更
フィールド名をダブルクリックして名称を編集することができます。
▼フィールドのデータタイプを変更
データタイプをクリックしてリストからタイプを変更することが可能です。
▼フィールドの並べ替え
フィールドカードをドラッグして任意の位置にドロップすることで、フィールドの順番を変更することができます。
▼フィールドの削除
フィールドのその他オプション「…」をクリックしてリストから「削除」を選択すれば、フィールドを削除できます。
データの編集
データの値の変更やマージ等のデータ項目を編集することもできます。
編集可能な項目は、フィールドのその他オプション「…」をクリックして、リストから「クリーニング」を選択すると一覧が表示されます。
▼大文字・小文字に変換
例えばフィールド「オーダーID」で「小文字にする」を選択すると、以下のようにすべてのデータの「JP」が「jp」になります。
▼文字・数字・句読点・スペースの削除
例えばフィールド「オーダーID」で「文字の削除」を選択すると、以下のようにすべてのデータの「JP」が削除されます。
▼特定のデータの値を変更
編集したいデータの値をダブルクリックして名称を変更することができます。
データの分割
データの値の一部を抽出して新たにフィールドを作成することができます。
例えば、製品名からメーカー名のフィールドを新たに作成してみます。
製品名に着目すると、先頭がメーカー名と製品名がスペースで接続された文字列で始まっていることが分かるので、スペースで分割するように設定します。
フィールド「製品名」のその他オプション「…」をクリックして、リストから「値の分割」-「カスタム分割」を選択します。
スペースで区切って最初の1フィールド分を切り出す設定にして、「分割」ボタンを押します。
すると製品名のフィールドが作成されました。
データの抽出
不要なデータ(行)を除外したり、条件を指定して一部のデータ(行)を抽出したりしたい場合には以下のようにします。
フィールドを選択してその他オプション「…」をクリック、リストから「フィルタ」を選択、さらに実行したいタスクを選択します。
▼計算式でフィルタ
計算式を定義して、その式に一致する行を抽出することができます。
例えば売上が10万円以上の行のみを抽出する場合には以下のように定義します。
▼値の範囲を指定
指定した範囲に一致する行を抽出することもできます。
例えば売上が10万円以上20万円以下の行を抽出する場合には以下のように指定します。
また、例えばオーダー日が2019年1月1日から2020年3月31日までの行を抽出する場合には以下のように指定します。
▼ワイルドカード一致
特定の条件に一致する行を抽出する場合に利用します。
例えば「JP-2020」で始まるオーダーIDの行のみを抽出する場合には以下のように指定します。
▼NULL値
NULL値を除外する場合に利用します。
例えばオーダーIDのNULL値を除外する場合には以下のように設定します。
本ページでは、Tableau Prep Builderでフィールドや値を編集することによって分析用にデータを加工する方法を紹介しました。