このページでは、Data Lake データセット用のフェデレーティッドデータベースインスタンスを作成する手順について説明します。
前提条件
始める前に、以下のものを用意してください。
フェデレーティッドデータベースインスタンスを作成するのと同じプロジェクト内の Atlas Data Lake データセット。
Project Owner
フェデレーティッドデータベースインスタンスを作成するプロジェクトのロール
手順
仮想データベース、コレクション、ビューを作成し、Data Lake データセットにマッピングします。
UI で希望のエディター ビューを使用するには、以下のタブの手順に従います。
(任意)クリックのために
Federated Database Instance フェデレーティッドデータベースインスタンスの名前を指定します。 デフォルトは
FederatedDatabaseInstance[n]
です。データベース名を編集するデータベース。 デフォルトは
Database[n]
です。databases.[n].name
JSON構成設定に対応します。コレクション名を編集するためのコレクション。 デフォルトは
Collection[n]
です。databases.[n].collections.name
JSON構成設定に対応します。を使用してビュー名を編集します。
次のコマンドをクリックできます。
Add Database : データベースとコレクションを追加します。
データベースにコレクションを追加するために関連付けられています。
コレクションにビューを追加するコレクションに関連付けられている ビューを作成するには、以下を指定する必要があります。
ビューの名前。
ビューに適用するパイプライン。
注意
ビュー定義パイプラインには、
$out
または$merge
ステージを含めることはできません。 ビュー定義に、$lookup
や$facet
などのネストされたパイプライン ステージが含まれている場合、この制限はそれらのネストされたパイプラインにも適用されます。ビューの詳細については、以下を参照してください。
関連付けられているデータベース、コレクション、またはビューを削除します。
注意
このチュートリアルの後半で実行できるサンプル クエリでは、仮想データベース名に
Database0
という名前を使用し、仮想コレクション名にCollection0
という名前を使用します。 ここで名前を変更する場合は、サンプル クエリの実行前に必ずサンプル クエリの名前も変更してください。コレクションとマッピングするには、 Data Lake Datasetをドラッグしてドロップします。
例
Atlas Data Lake パイプラインの作成 - プレビューの例を使用してサンプル データ用に作成した Atlas Data Lake データセット用のフェデレーティッドデータベースインスタンスを作成している場合。
[ Datasets Ingestion Pipelineで、まだ選択されていない場合は、ドロップダウンから [] を選択します。
[ Data Lake Datasetセクションで、
sample_mflix.movies
という名前のデータセットをドラッグし、 コレクションの下に削除します。
databases.[n].collections.[n].dataSources
JSON構成設定に対応します。
フェデレーティッドデータベースインスタンスのストレージ構成で、データセットをデータストアとして定義します。
stores
の UI に表示されるJSON構成設定を編集します。stores
の構成設定は次のようになります。{ "stores": [ { "name": "<store-name>", "provider": "<cloud-storage-provider-name>", "region": "<cloud-storage-provider-region>" } ] } これらの設定の詳細については、「 Atlas Data Lake データセットのストレージ構成 」を参照してください。
例
Atlas Data Lake パイプラインの作成 - プレビューの例を使用してサンプル データ用に作成した Atlas Data Lake パイプライン用のフェデレーティッドデータベースインスタンスを作成している場合は、UI に表示されるJSON構成設定の
stores
を で置き換えます。以下は次のとおりです。{ "stores": [ { "name": "dls-store-us-east-1", "provider": "dls:aws", "region": "US_EAST_1" } ] } Atlas Data Federation のストレージ構成でデータセットの仮想データベース、コレクション、ビューを定義します。
{ "databases": [ { "name": "<database-name>", "collections": [ { "name": "<collection-name>", "dataSources": [ { "storeName": "<store-name>", "datasetName": "<snapshot-name>" } ] } ], "views": [] } ] } これらの設定の詳細については、「 Atlas Data Lake データセットのストレージ構成 」を参照してください。
例
Atlas Data Lake パイプラインの作成 - プレビューの例を使用してサンプル データ用に作成した Atlas Data Lake データセット用のフェデレーティッドデータベースインスタンスを作成している場合は、UI に表示されるJSON構成設定の
databases
を に置き換えます。以下は次のとおりです。{ "databases": [ { "name": "Database0", "collections": [ { "name": "Collection0", "dataSources": [ { "storeName": "dls-store-us-east-1", "datasetName": "v1$atlas$snapshot$dlsTest$sample_mflix$movies$$.<snapshot-id>" } ] } ], "views": [] } ] }
次のステップ
Data Lake データセット用のフェデレーティッドデータベースインスタンスを作成したので、 「 フェデレーティッドデータベースインスタンスへの接続 - プレビュー 」に進みます。