/ /

部署一个联合数据库实例。

预计完成时间：15 分钟

本教程的这一部分将指导您在Atlas 用户界面中使用以下快速入门向导来部署联合数据库实例：

Feed Downstream Systems 向导可帮助您设立联合数据库实例，以便从Atlas 集群导出数据，将数据转换为 Parquet、逗号分隔值（CSV）、 BSON或MongoDB扩展JSON ，并将数据复制到Amazon Web Services S3 存储桶使用Atlas Triggers按指定时间间隔触发。
“使用样本数据浏览”向导可帮助您设立加载示例数据的联合数据库实例，以演示如何连接到联合数据库实例并运行查询。
跨集群查询数据向导可帮助您设立联合数据库实例，该实例访问多个Atlas集群的数据，以便您可以跨所有集群的集合运行联合查询。

要学习有关存储配置选项的更多信息，请参阅为联合数据库实例配置数据存储。

必需的访问权限

要部署联合数据库实例，您必须对项目拥有 Project Owner 访问权限。

重要

在部署其联合数据库实例之前，具有 Organization Owner访问权限的用户必须将自己作为添加到项目中。Project Owner

先决条件

要完成本教程的这一部分，请确保满足以下先决条件：

创建一个MongoDB Atlas帐户（如果还没有帐户）。
对于 Feed Downstream Systems 向导，您需要：
- Amazon Web Services CLI，配置为访问权限您的Amazon Web Services帐户。或者，您必须有权访问Amazon Web Services管理控制台并有权创建IAM 角色。
- 一个 S3 存储桶，用于存储提取到的数据。
- 至少一个带有数据库的 Atlas 集群。
对于“跨集群查询数据”向导，您需要：
- 至少一个Atlas 集群部署在您将用于联合数据库实例的项目中。
- 至少一个数据库集合。如果还没有集合，可以加载示例数据。

使用 Feed Downstream Systems 向导

Feed Downstream Systems 向导可帮助您设置联合数据库实例，该实例可定时将数据从 Atlas 集群连续写入 AWS S3 存储桶。

登录到 MongoDB Atlas。

选择左侧导航栏中的Data Federation 选项。

创建联合数据库实例。

点击 Create New Federated Database（新建联合数据库）下拉列表。
选择 Feed Downstream Systems 。

单击Get Started 。

在字段中输入联合数据库实例的名称，然后单击Federated Database Instance Name Continue。

默认值为 FederatedDatabaseInstance[n]。一旦联合数据库实例被创建，您将无法更改它的名称。

指定数据源。

从下拉列表中选择要用作数据源的Atlas 集群。默认， Atlas Data Federation会添加此集群中的所有集合。要使用部分数据，请单击Specific Collections ，展开数据库，然后选择要添加到联合数据库实例的集合。
提示
要过滤数据库和集合，请在Specific Collections字段中输入文本。该对话框仅显示名称与搜索条件匹配的数据库和集合。
单击 Continue（连接）。

为Atlas选择一个 AWS IAM角色。

您可以从角色选择下拉列表中选择已获得授权的现有Amazon Web Services IAM角色，也可以选择Atlas Authorize an AWS IAM Role以授权新角色。

如果您选择了一个已经被 Atlas 授权的现有角色，请继续下一步，列出您的 AWS S3 存储桶。

如果要为现有角色授权 Atlas 或创建新角色，请先完成以下步骤，然后再继续下一步：

从下拉列表中选择Authorize an AWS IAM Role以授权新角色或选择现有角色。
在 Role Authorization 部分中使用Amazon Web Services ARN和唯一外部ID ，将Atlas添加到现有或新Amazon Web Services IAM角色的信任关系中。
在Atlas 用户界面中，单击以下选项之一：
- Create new AWS IAM role 演示如何使用ARN和唯一外部ID将Atlas添加到新Amazon Web Services IAM角色的信任关系中。按照Atlas用户界面中的步骤创建新角色。要学习；了解更多信息，请参阅使用Amazon Web Services CLI创建新角色。
  
  授权新角色时，如果退出工作流程：
  - 在验证角色之前，Atlas 不会创建联合数据库实例。您可以Go AtlasIntegrations页面授权新角色，然后在拥有 IAM 角色Amazon Web Services ARN 时再次启动部署联合数据库实例的过程。
  - 验证角色后，Atlas 将不会创建联合数据库实例。但是，此角色可在角色选择下拉列表找到，可用于创建联合数据库实例。您无需重新授权此角色。
- Use existing AWS IAM role展示如何使用ARN和唯一外部 ID 将 Atlas 添加到现有Amazon Web Services IAM角色的信任关系。按照 Atlas 用户界面中的步骤操作，将 Atlas 添加到现有角色的信任关系。要了解更多信息，请参阅为现有角色添加信任关系。
重要
如果您之后想要修改自定义 AWS 角色的 ARN，则请确保在此角色的访问策略中，对联合数据库实例所用 S3 资源拥有适当的访问权限。
要学习；了解更多信息，请参阅设置统一Amazon Web Services访问权限和创建云提供商访问角色。
单击 Validate AWS IAM role（连接）。

为您的 AWS IAM角色分配访问权限策略。

输入您 S3 存储桶的名称。
按照 Atlas UI 所示步骤，为您的 AWS IAM 角色指定访问策略。
单击 Validate AWS S3 bucket access（连接）。
单击 Continue（连接）。

安排数据提取。

使用部分中的 $out 安排一个触发，以持续将数据从Atlas 集群复制到 S3Schedule Queries 存储桶。

使用Repeat Once By下拉列表指定从Atlas 集群提取数据的频率。
可选。指定 Atlas Data Federation 由于任何原因错过查询时是否必须重新运行同一查询。默认情况下，此功能处于禁用状态，以允许 Atlas Data Federation 重新运行错过的查询。或者，要跳过错过的查询而不追赶，请开启Skip Catch Up Events 。
可选。选择Atlas Data Federation将数据写入 S3 存储桶时，您所需的数据格式。Atlas Data Federation支持 Parquet、逗号分隔值（CSV）、BSON和MongoDB Extended JSON。
指定Max File Size以限制Atlas Data Federation写入S 3存储桶时每个文件的大小。示例，如果您设立Max File Size设置为100 MB，并且查询返回1 GB的数据，则Atlas Data Federation会将该查询以10个文件的形式写入3存储桶，每个文件的大小为100 MB。
输入目标 S3 存储桶的Amazon Web Services前缀。
在Date Field中输入索引日期字段的名称，然后使用下拉列表指定其值的格式。要复制到下游的每个集合都必须有一个将时间戳存储为值的索引字段。
单击 Continue（连接）。

单击Create 。

使用“探索样本数据”向导

“浏览样本数据”向导可帮助您设置加载样本数据的联合数据库实例。

登录到 MongoDB Atlas。

选择左侧导航栏中的Data Federation 选项。

创建联合数据库实例。

点击 Create New Federated Database（新建联合数据库）下拉列表。
选择 Explore with Sample Data 。

单击Get Started 。

单击Create 。

此联合数据库实例包括以下示例数据集，您可以用它们来练习运行查询：

/airbnb/listingsAndReviews/{bedrooms int}/{review_scores.review_scores_rating int}/

此路径引用了airbnb数据集，其中包含度假屋列表详细信息和客户评论。要了解有关此数据集的更多信息，请参阅示例 AirBnB 列表数据集。

对于此路径，联合数据库实例使用针对bedrooms字段和review_scores.review_score_ratings字段的查询优化的分区。
/analytics/accounts/{limit int}/

此路径引用了analytics数据集，其中包含典型金融服务应用程序的数据。要了解有关此数据集的更多信息，请参阅样本分析数据集。

对于此路径，联合数据库实例使用针对limit字段查询优化的分区。
/analytics/customers/{birthdate isodate}/

此数据引用了analytics数据集，其中包含典型金融服务应用程序的集合。要学习；了解有关此数据集的更多信息，请参阅示例分析数据集。

对于此路径，联合数据库实例使用针对birthdate字段查询优化的分区。
/analytics/transactions/{account_id int}/

此路径引用了analytics数据集，其中包含典型金融服务应用程序的数据。要了解有关此数据集的更多信息，请参阅样本分析数据集。

对于此路径，联合数据库实例使用针对account_id字段查询优化的分区。
/mflix/movies/{type string}/{year int}/

此路径引用了mflix数据集，其中包含有关电影和电影院的数据。要了解有关此数据集的更多信息，请参阅样本 Mflix 数据集。

对于此路径，联合数据库实例使用针对type和year字段的查询优化的分区。
/mflix/sessions.json

此路径引用了mflix数据集，其中包含有关电影和电影院的数据。要了解有关此数据集的更多信息，请参阅样本 Mflix 数据集。

此路径不包含任何分区属性，因此在对集合中的数据进行查询时， Data Federation 将搜索集合中的所有文件。
/mflix/theaters/{theaterId string}/{location.address.zipcode string}/

此路径引用了mflix数据集，其中包含有关电影和电影院的数据。要了解有关此数据集的更多信息，请参阅样本 Mflix 数据集。

对于此路径，联合数据库实例使用针对theaterId和location.address.zipcode字段的查询优化的分区。
/mflix/users.json

此路径引用了mflix集合，其中包含有关电影和电影院的数据。要了解有关此数据集的更多信息，请参阅样本 Mflix 数据集。

此路径不包含任何分区属性，因此在对集合中的数据进行查询时，联合数据库实例将搜索集合中的所有文件。
/nyc-yellow-cab-trips/{trip_start_isodate isodate}/{passenger_count int}/{fare_type string}/

此路径引用了nyc-yellow-cab-trips数据集，其中包含行程数据，包括行程日期、票价和乘客数量。

对于此路径，联合数据库实例使用针对trip_start_isodate 、 passenger_count和fare_type字段的查询优化的分区。

使用“跨集群查询数据”向导

跨集群查询数据向导可帮助您设置联合数据库实例，此实例可访问来自多个 Atlas 集群的数据。

登录到 MongoDB Atlas。

选择左侧导航栏中的Data Federation 选项。

创建联合数据库实例。

点击 Create New Federated Database（新建联合数据库）下拉列表。
选择 Query Data Across Clusters 。

单击Get Started 。

在字段中输入联合数据库实例的名称，然后单击Federated Database Instance Name Continue。

默认值为 FederatedDatabaseInstance[n]。一旦联合数据库实例被创建，您将无法更改它的名称。

指定要用作数据源的Atlas集群。

从下拉列表中选择一个Atlas 集群，将其用作数据源。在此下拉菜单中， Atlas 仅显示您当前 Atlas 项目中的集群。
展开数据库并选择要添加到联合数据库实例中的集合。
提示
要过滤数据库和集合，请在Specific collections字段中输入文本。该对话框仅显示名称与搜索条件匹配的数据库和集合。

可选。展开Cluster Read Preference设置以配置以下字段。

字段名称	说明
Read Preference Mode	指定您想将读取请求路由到的副本集成员。您可以从下拉列表中选取其一： `primary` — 将所有读取请求路由到副本集主节点 (primary node in the replica set) `primaryPreferred` - 仅当`primary`不可用时，将所有读取请求路由到副本集主节点 (primary node in the replica set)和从从节点(secondary node from replica set)成员 `secondary` - 将所有读取请求路由到副本集的从节点 `secondaryPreferred` - 仅当成员不可用时，将所有读取请求路由到副本集的从主节点 (primary node in the replica set) 和分片集群上的从节点(secondary node from replica set) 分片的`secondary` `nearest` - 将所有读取请求路由到符合条件的随机副本集成员，无论该成员是主节点 (primary node in the replica set)还是从从节点(secondary node from replica set) 如果将Atlas 集群添加为存储，则默认值为`secondary` 。如果您没有在联合数据库实例存储配置中设立任何内容，则默认值为`nearest` 。要学习；了解更多信息，请参阅读取偏好模式。重要提示： Data Federation和主节点影响当Data Federation查询配置了针对从节点(secondary node from replica set)节点的读取偏好（read preference）时，它们不会在后端Atlas 集群的主节点 (primary node in the replica set)上产生负载。在从从节点(secondary node from replica set)上启动的查询在其生命周期内保持与该节点的游标关联性。在某些日志中，可能会显示 `getMore` 操作，其读取偏好（read preference）为 `primaryPreferred`。这是预期行为，并不表示游标已切换到主节点 (primary node in the replica set)。`primaryPreferred`模式在主节点 (primary node in the replica set)和从节点(secondary node from replica set)上均有效，并允许驱动程序处理罕见的角色变更（例如从节点(secondary node from replica set)变主节点 (primary node in the replica set)），而无需重新发出查询。游标将在原始节点上继续执行，除非该节点本身更改角色。 Data Federation将其工作负载与主节点 (primary node in the replica set)隔离，无需任何额外配置。使用 `primaryPreferred`模式可确保与主节点 (primary node in the replica set)和从节点(secondary node from replica set)的兼容性，从而允许驱动程序处理罕见的角色变更（例如从节点(secondary node from replica set)变主节点 (primary node in the replica set)，而无需重新发出查询。游标将在原始节点上继续执行，除非该节点本身更改角色。
TagSets	指定标签或标签规范文档列表，其中包含要将读取请求路由到的副本集节点的名称和值对。要学习；了解更多信息，请参阅读取偏好标签集。
Maxstaleness Seconds	指定从节点读取的最大复制延迟或“过时时间”。要学习；了解更多信息，请参阅读取偏好 maxStalenessSeconds。

单击Add Atlas cluster and collection ，并对要用作数据源的所有 Atlas 集群重复这些步骤。
添加完集群后，单击Continue 。

单击Create 。

后续步骤

现已部署联合数据库实例，请继续为联合数据库实例配置连接。

部署一个联合数据库实例。

必需的访问权限

重要

先决条件

使用 Feed Downstream Systems 向导

登录到 MongoDB Atlas。

选择左侧导航栏中的Data Federation 选项。

创建联合数据库实例。

单击Get Started 。

在 字段中输入联合数据库实例的名称，然后单击Federated Database Instance Name Continue。

指定数据源。

提示

为Atlas选择一个 AWS IAM角色。

重要

为您的 AWS IAM角色分配访问权限策略。

安排数据提取。

单击Create 。

使用“探索样本数据”向导

登录到 MongoDB Atlas。

选择左侧导航栏中的Data Federation 选项。

创建联合数据库实例。

单击Get Started 。

单击Create 。

使用“跨集群查询数据”向导

登录到 MongoDB Atlas。

选择左侧导航栏中的Data Federation 选项。

创建联合数据库实例。

单击Get Started 。

在 字段中输入联合数据库实例的名称，然后单击Federated Database Instance Name Continue。

指定要用作数据源的Atlas集群。

提示

单击Create 。

后续步骤

在字段中输入联合数据库实例的名称，然后单击Federated Database Instance Name Continue。

在字段中输入联合数据库实例的名称，然后单击Federated Database Instance Name Continue。