Tableau Prepはデータを分析に適した形に加工するツールで、その処理過程を記録して共有したり再利用したりすることができます。
本ページでは、Tableau Prep Builderにおけるデータソースへの接続と接続先からのデータ入力、入力したデータを更新する方法を紹介します。
データソースへの接続
ファイルへの接続
Tableau Prep Builderは以下のように様々な形式のファイルに接続ができます。
「Microsoft Excel」を選択するとエクセルのファイルにアクセスできます。
「テキスト ファイル」を選択すると、テキスト形式(.txt)、カンマ区切り形式(.csv)やタブ区切り形式(.tsv)等のファイルにアクセスできます。
例えば新型コロナウィルス感染者数データ(.csv)を指定すると、以下のように表示されます。
他にも「統計ファイル」を選択するとSASやSPSS、R等の統計ソフトのファイルにもアクセスできます。
「空間ファイル」を選択するとはシェープファイルやgeojson等様々な地理情報関連ファイルにもアクセスできます。
例えば東京都23区のポリゴンデータ(.geojon)を指定すると、以下のように表示されます。
サーバのデータベースへの接続
Tableau Prep Builderはローカルのファイルだけでなくサーバにあるデータベース上のデータに接続することができます。
以下にあるように、多くの種類のデータベースへのコネクタがサポートされています。
例えば、スーパーストアのデータを格納したPostgreSQLに接続して注文データを入力する場合には以下のようにします。
コネクタの一覧から「PostgreSQL」を選択します。
接続設定画面に移るので、サーバーに接続先サーバ名またはIPアドレス、ポート番号、接続先データベース名を設定します。
データベースへのアクセス形式がパスワード認証の場合には、認証に「ユーザ名とパスワードを」設定の上、ユーザ名とパスワードを入力します。
接続するとデータベースのテーブルリストが接続ペインに表示されます。
注文データのテーブルをフローペインにドラッグ&ドロップします。
注文データが読み込まれます。
接続先からのデータ入力
ファイルやデータベースに接続できたら、次は必要なデータをTableau Prep Builderに入力します。
入力の際には、テーブル全体だけでなく必要なデータを手動あるいはSQLで抽出した後に入力することができます。
手動でデータ抽出
データを絞り込んで抽出する処理は「クリーニングステップ」でも可能ですが、データ入力時にできれば後の処理が軽くなるメリットがあります。
あらかじめ必要なデータが分かっている場合や、データ量の大きいデータソースに接続する場合には有効な方法です。
手動でのデータの抽出はデータ入力のプロファイルペインで行います。
プロファイルペインのチェックボックスを外して不要なフィールドを除外したり、検索フィールドで対象を絞り込んだりすることができます。
また、フィールド名を変更することもできます。
カスタムSQLで抽出
接続先のデータソースからSQLで必要なデータを取得することができます。
データソースに接続した後、接続ペインの下にある「カスタムSQL」をダブルクリックします。
するとフローペインにカスタムSQLのアイコンが表示され、プロファイルペインが現れます。
この時点ではエラーマークが表示されていますが、気にせず進めます。
プロファイルペインの「カスタムSQL」タブで、SQL文を作成して「実行」ボタンをクリックします。
以下は、注文テーブルから東京都の売上10万円以上の注文を抽出するSQLの例です。
抽出結果は、クリーニングステップを追加してプロファイルペインおよびデータグリッドで確認します。
正しく抽出できていることが分かります。
入力済データの更新
フローの作成開始後あるいは保存後に入力データが更新されたので、その分もフローに反映させたいという場合はどうしたらよいでしょうか?
そのような場合にはデータ入力を更新して新しいデータを取り込むことができます。
以下では、(1)ファイルから入力したデータと(2)データベースから入力したデータの更新方法をそれぞれを紹介します。
ファイルから入力したデータの更新
はじめにファイルから入力したデータを更新する方法です。
2通りあります。
1つ目は、フローペインのトップメニューで「更新」をクリックして、更新したい入力データを選択します。
2つ目は、フローペインにある更新したい入力データのアイコンを右クリックして、リストから「更新」を選択します。
以上のいずれかの方法でファイルから入力したデータが更新されます。
データベースから入力したデータの更新
次はデータベースから入力したデータを更新する方法です。
こちらも方法は2通りあります。
1つ目は、接続ペインでデータソースの右「▼」印をクリックしてリストから「編集」を選択します。
するとサインインを求められるので、再度接続します。それによって入力データが更新されます。
2つ目は、フローペインでデータ入力ステップを削除して、もう一度作成する方法です。
以下のように、フローペインで更新したいデータ入力ステップを右クリックしてリストから「削除」を選択します。
この時点では、フローペインからデータ入力アイコンが消えてエラーマークが表示されます。
今度は更新したファイルに接続し、接続ペインからデータのアイコンをドラッグして、フローペインのデータ入力直後のステップに重ねて表示されるオプションの「追加」にドロップします。
エラーマークが消えて、入力データが更新されます。
本ページでは、Tableau Prep Builderにおけるデータソースへの接続と接続先からのデータ入力、入力したデータを更新する方法を紹介しました。