为了优化查询性能,Atlas Data Federation 会执行以下操作:
对于 Cloud Object Storage,它使用数据分区来根据查询参数选择需要进程的文件。要学习;了解详情,请参阅 定义路径文件事务语法 和 使用分区属性类型。此外,它还使用 Parquet元数据来减少通过行群组选择或列投影从 Parquet 文件扫描的数据量。要学习;了解更多信息,请参阅 Parquet 数据格式。
对于Atlas集群,它会尝试将尽可能多的查询“下推”到集群。示例,如果您的聚合管道有一个
$match阶段,并且可以在本地处理,Atlas Data Federation 会尝试在 Atlas 集群中处理该阶段,并且仅将生成的文档返回到联合层用于处理后续阶段。要学习;了解更多信息,请参阅在Atlas集群中查询数据。
要了解更多信息,请参阅优化查询性能。
您可以使用 MongoDB 语言特定的驱动程序、 mongosh和Atlas SQL连接到 Atlas Data Federation。 要了解更多信息,请参阅连接到您的联合数据库实例。