El muestreo en Atlas es la selección de un subconjunto de documentos de una colección para su análisis. El análisis de un conjunto de datos de muestra es una técnica estadística común; los resultados del análisis de un conjunto de muestras tienden a ser similares a los resultados del análisis de un conjunto de datos completo.
Atlas utiliza el muestreo por eficiencia. Generalmente, los conjuntos de muestras estándar pueden seleccionarse y analizarse en unos pocos segundos. Analizar grandes muestras o colecciones enteras exige significativamente más tiempo y capacidad de procesamiento.
Método de muestreo
Atlas muestrea documentos 1,000 de una colección utilizando la $muestra operador mediante el pipeline de agregación. Esto proporciona un muestreo aleatorio eficiente sin reemplazo sobre toda una colección, o sobre el subconjunto de documentos especificado por una query.