
本ブログシリーズでは、SAP S/4HANA(以下、「S/4」) とSAP Datasphere (以下、「Datasphere」) とのデータ連携の設定について解説します。
今回はDatasphere で「データフロー」を作成する手順について解説します。
データフローはDatasphere のETL機能です。データを抽出(Extract)して変換(Transform)してローディング(Load)するデータ連携機能です。
メニューの「データビルダ」を選択し、「フロー」タブを選択した後、「新規データフロー」をクリックします。
左メニューの「ソース」を選択し、S/4の「接続」から「接続からインポート」ボタンをクリックして検索画面を表示します。
※ データビルダで展開表示されるCDS View の数は上限があり、全てのCDS View が一覧表示されません。この手順で目的のCDS View を検索し、選択する必要があります。
検索画面ではCDS View名を指定し、目的のCDS Viewが見つかったらチェックボックスをチェックして次へ進みます。
ちなみにここで指定するCDS View 名はリモートテーブルで指定するCDS View 名 とは違うので注意してください。
内容を確認して「選択を追加」ボタンをクリックします。
S/4システムのCDS View に対して「ラベル」が作成されました。これはリモートテーブルのようなオブジェクトではないので注意してください。「データプレビュー」ボタンをクリックするとリモートのデータが参照可能です。
続いて、このリモートソースのデータを格納するための「ターゲットテーブル」を作成します。図のように「テーブルを追加」ボタンをクリックすると、ソースのテーブルの項目(列)と同じ項目から構成されるターゲットテーブルを作成します。
ターゲットテーブルに対してビジネス名と技術名を付けて、「テーブルを作成して配置」ボタンをクリックしてデプロイします。確認画面が表示されるのでそのまま進んでください。
ターゲットテーブルが作成されました。
参考までに下記のような定義のターゲットテーブルが作成されました。
リモートテーブルとの違いはビジネス名を自動的に付加することができず、技術名と同じ項目名がビジネス名に付けられます。ビジネス名は変更可能です。
このタイミングでターゲットテーブルに対してデータをロードする際、「データを全削除する」ために「TRUNCATE(削除)」を指定します。「APPEND(追加)」や「DELETE(削除)」も選択可能です。
※ TRUNCATEはデータベース内で更新ログ(REDOログ)を作成せずに高速にデータ削除する方法です。
キャンバスの空白の部分をクリックして、データフローに対して名前を付けます。
命名したら、設定を保存後、デプロイしてください。
デプロイが完了したら、画面左上のメニューから「実行」ボタンをクリックしてデータフローを実行します。
「リフレッシュ」ボタンをクリックしてステータスが完了したらターゲットテーブルの「データプレビュー」ボタンをクリックしてデータがロードされているかどうか確認します。
データフローはスケジュール実行することができます。
データフローの設定画面にて、「スケジュールを作成」を選択します。
1時間毎にスケジュール実行する設定例は下記の通りです。
スケジュールの設定情報や実行ステータスは「データ統合モニタ」の「フロー」タブで確認することができます。
※ このデータ統合モニタからデータフローのスケジュールを作成することも可能です。
ちなみに「複製フロー」という機能も「データフロー」と同様にCloud Connector 経由でのデータ連携になります。「複製フロー」は下記のブログを参考にしてください。
設定は以上です。
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.
User | Count |
---|---|
18 | |
14 | |
11 | |
9 | |
9 | |
7 | |
6 | |
6 | |
5 | |
5 |