Make the MongoDB docs better! We value your opinion. Share your feedback for a chance to win $100.
MongoDB Branding Shape
Click here >
Docs Menu

Registro de cambios de Data Federation

Nota

Las notas de la versión mencionan solo los lanzamientos con cambios de funcionalidades

MongoDB lanza la Federación de Datos de Atlas cada semana, mejorando continuamente el rendimiento y la estabilidad de la Federación de Datos de Atlas. Estas notas de la versión solo capturan los lanzamientos que contienen cambios en la funcionalidad. Si una versión específica de Atlas Data Federation incluye solo mejoras de rendimiento y estabilidad, no se incluye en estas notas de la versión. Para identificar qué versión de lanzamiento está utilizando, verifique la string de versión de lanzamiento para la fecha de lanzamiento.

  • Admite la capacidad de leer archivos Parquet con zstd compresión de columna.
  • Cambia qué regiones procesan datos para regiones no compatibles:

    • ca-central-1 (Montreal) procesará datos de ca-west-1 (Alberta) en lugar de eu-west-1 (Ireland).

    • ap-northeast-1 (Tokyo) procesará datos:

      • de ap-northeast-2 (Seoul) en lugar de eu-west-1 (Ireland).

      • de ap-northeast-3 (Osaka) en lugar de eu-west-1 (Ireland).

      • de ap-east-1 (Hong Kong) en lugar de ap-southeast-2 (Sydney).

  • Corrige un problema en el que el comando killOp no podía terminar una query.

  • Agrega soporte para la etapa $sql en las vistas de Atlas Data Federation.

  • Corrige un problema por el cual, al crear una vista, Atlas Data Federation no verificaba correctamente los permisos.

  • Resuelve un problema donde las fechas generadas en el formato ISO 8602 provocaban resultados incorrectos en las query.
  • Corrige un problema que impedía que el controlador de Python no pudiera conectarse cuando se usaba la autenticación AWS IAM.

  • Soluciona un problema que hacía que las query $limit fallaran con un InternalError.

  • Mejoras en el filtrado de particiones de plantillas en el planificador de consultas, lo que mejora el rendimiento de las consultas en ciertos casos frente a múltiples fuentes de almacenamiento de objetos.

  • Permite que los almacenes de datos de Azure estén disponibles de manera general tanto para tus implementaciones de desarrollo como de producción.
  • Admite AWS IAM si se configura AWS IAM para autenticación. Esto no está soportado actualmente en la Interfaz de Usuario de Atlas.
  • Cambia el error CommandNotSupported a CommandNotFound.
  • Mejora el rendimiento al leer desde archivos Parquet.

  • Añade soporte para modificar vistas con collMod.

  • Agrega el reconocimiento automático de archivos .jsonl como archivos JSON Lines.

  • Soluciona un problema con sqlGenerateSchema donde no se ejecutaba en la fuente del fichero en línea.

  • Mejora el mensaje de error al exceder el límite de maxTimeMS.

  • Mejora los resultados de explain() para queries que se dirigen a conjuntos de datos de Atlas Data Lake y ficheros en línea.

  • Mejora el rendimiento de las consultas que utilizan el operador $ne.
  • Soporta la variable de agregación $$SEARCH_META cuando se ejecutan consultas $search en un clúster de Atlas a través de Atlas Data Federation.
  • Incluye una nueva experiencia de incorporación con plantillas para los casos de uso más comunes de Atlas Data Federation.

  • Mejora el mensaje de error para consultas $out to S3 para proporcionar más detalles.

  • Optimiza los atributos de partición para seleccionar archivos en S3 al utilizar el operador $in en las pipelines de agregación.
  • Modifica el comportamiento de $queryHistory para indicar que una query se ha completado cuando todos los lotes se han subido como archivos cursor, todos los lotes se han devuelto al usuario o hay un error.

  • Agrega la capacidad de utilizar datos BSON para el campo comentario en los comandos.

  • Mejora los mensajes de error al consultar un documento de más de 16 MB.

  • Soluciona un problema de precisión en $getFields donde Atlas Data Federation difería de MongoDB al consultar un subdocumento vacío.

  • Mejora la estabilidad y el rendimiento de $out a S3 al escribir en Parquet.

  • Corrige un problema con las $match queries que resultaba en que los documentos no se devolvían al consultar documentos anidados dentro de un arreglo cuando faltaba el campo objetivo en cualquier documento anidado.

  • Mejora el rendimiento y la estabilidad al escribir en Parquet usando $out para S3.

  • Agrega la capacidad de usar cualquier tipo BSON con el operador $comment y query en $queryHistory. (A partir de MongoDB 5.1, el operador $comment fue eliminado).

  • Atlas Data Federation ahora devuelve MongoDB 6.2.0 en la salida de buildInfo.

  • Agrega la capacidad de limitar la cantidad de datos que Atlas Data Federation procesa para sus instancias federadas de base de datos para controlar los costos.
  • Mejora los mensajes de error cuando un cliente intenta insertar, actualizar o borrar un documento en una instancia de base de datos federada.
  • Agrega el nombre de la aplicación a las conexiones que Atlas Data Federation crea a tus clústeres de Atlas.

  • Agrega la capacidad de establecer y actualizar la configuración de almacenamiento utilizando la API de Atlas.

  • Corrige un problema que causaba que maxTimeMS con un batchSize de 0 fallara.
  • Agrega nuevas capacidades a la configuración de almacenamiento para admitir la procedencia de los datos y mejorar la flexibilidad para federación.

  • Añade la región AWS ap-southeast-1 (Singapur).

  • Actualiza Atlas Data Federation a MongoDB 6.0.2.
  • Mejora el rendimiento y la estabilidad.

  • Mejora el rendimiento de las queries en conjuntos de datos de Atlas Data Lake utilizando metadatos de ordenación para optimizar las queries.

  • Corrige un problema que causaba que Atlas Data Federation no pudiera leer un archivo Parquet cuando el esquema de nivel superior o raíz estaba marcado como REPEATED o OPTIONAL.

  • Mejora la estabilidad al escribir en Parquet utilizando $out para S3.

  • Corrige el error en el pipeline $not y $in que causaba un pánico de expresión no soportada.

  • Mejora el rendimiento de $out para las queries de S3 que guardan en formato de archivo Parquet.

  • Actualiza el tamaño máximo por defecto del grupo de filas a 128MB para el escritor parquet.

  • Mejora las etapas $group en los campos de partición de Dataset de lago de datos.

  • Corrige los pipelines de agregación con múltiples etapas $lookup donde una etapa define un campo y otra remueve el mismo campo.

  • Corrige cómo Atlas Data Federation gestiona los archivos en S3 que terminan con el carácter delimitador (por ejemplo, '/').

  • Mejora el rendimiento y la estabilidad.

  • Añade soporte para especificar opcionalmente un formato ISODate para optimizar el rendimiento de las particiones de tipo fecha.

  • Mejora el rendimiento y la estabilidad.

  • Ejecuta $merge en fragmentos.

  • Mejora el rendimiento y la estabilidad.

  • Atlas ahora cobra por el número total de bytes que Atlas Data Federation procesa desde fuentes HTTP.

  • Agrega compatibilidad con la opción segundo plano en la etapa de agregación $merge.

  • Mejora el rendimiento y la estabilidad.

  • Agrega soporte para Atlas Data Lake como un "Tipo de almacenamiento" al comando createStore.

  • Mejora los mensajes de error para las consultas Federadas $search.

  • Renombra y relanza Atlas Data Lake como Atlas Data Federation.

    Importante

    El servicio de motor de consulta federada anteriormente denominado Atlas Data Lake ahora se llama Atlas Data Federation. Para obtener más información sobre Atlas Data Federation, consulte Atlas Data Federation.

  • Mejora el rendimiento y la estabilidad.

  • Desactiva el soporte para el dialecto MySQL.

  • Mejora el rendimiento y la estabilidad.
  • Mejora el rendimiento y la estabilidad.

  • Admite los siguientes nuevos operadores de agregación de MongoDB 5.2:

    • $sortArray

    • $topN

    • $bottomN

    • $maxN

    • $firstN

    • $lastN

  • Corrige un error para permitir el uso de la preferencia de lectura en clústeres sharded.

  • Mejora el rendimiento y la estabilidad.
  • Mejora el rendimiento y la estabilidad.

  • Impone un límite superior a maxRowGroupSize.

  • Mejora el rendimiento y la estabilidad.

  • Soporta consultas en colecciones con el prefijo system, pero no admite consultas en colecciones con el prefijo system..

  • Mejora el rendimiento y la estabilidad.

  • Agrega soporte con la opción $maxTimeMS.

  • Mejora el rendimiento y la estabilidad.

  • Permite conexiones a lagos de datos a través de nodos privados.

  • Agrega soporte para la autorización X.509.

  • Agrega soporte para parámetros vacíos field con la expresión de agregación $setField.

  • Se corrige un problema en el que los comandos devolvían códigos de salida cero al fallar.

  • Corrige un problema donde los documentos con subdocumentos vacíos, escritos como Parquet, contenían grupos de Parquet vacíos.

  • Actualiza EstimateRowGroupSize para reportar UncompressedSize para documentos almacenados en Parquet.

  • Ajusta el valor mínimo para maxRowGroupSize al utilizar $out a Parquet a 16MB.

  • Remueve la compatibilidad para usar $out para guardar documentos que contienen campos duplicados en Parquet.

  • Mejora los mensajes de error para $out.

  • Mejora el rendimiento y la estabilidad.

  • Incluye X.509 usuarios en la salida del comando usersInfo.

  • Mejora el rendimiento de la autenticación SCRAM.

  • Mejora el rendimiento y la estabilidad.

  • Agrega compatibilidad para el comando authenticate.

  • Preserva los subtipos binarios en el lector/escritor de parquet.

  • Proporciona varias mejoras de estabilidad.

  • Mejora el rendimiento y la estabilidad de collStats y dbStats comando.

  • Añade soporte para las $merge etapas del pipeline de agregación.

  • Permite localField y foreignField con una sintaxis de las $lookup etapas del pipeline de agregación más expresiva.

  • Implementa el acumulador $count.

  • Mejora el rendimiento.

  • Mejora los mensajes de error.

  • Añade los campos computeTime y automaticRefreshInProgress a las salidas de los comandos collStats y dbStats.

  • Admite eliminar almacenes y bases de datos inexistentes de la configuración de almacenamiento.

  • Incluye partitions.count en el resultado del comando collStats.

  • Permite descargar los registros de consultas de Data Federation desde la interfaz de usuario y la API.

  • Elimina la restricción en los espacios de nombre de colecciones grandes.

  • Añade la opción para omitir la caché para collStats y dbStats para obtener las estadísticas más recientes.

  • soporte serverStatus command.

  • Mejora la estabilidad y el rendimiento.

  • Admite almacenes de datos públicos de S3 con la bandera de configuración public.

  • Admite compresión Zstandard cuando se federan consultas a clústeres de Atlas.

  • Agrega el campo db al resultado dbStats.

  • Admite la selección de preferencia de lectura, etiquetas de lectura y máximo rezago a través de la configuración de almacenamiento para los almacenes de Atlas clúster.

  • Rechaza los comandos enviados con un conjunto de API versionado.

  • Activa el parámetro count en la etapa de agregación del lago de datos $collStats Stage (Atlas Data Federation).

  • Ya no permite la $collStats Stage (Atlas Data Federation) en las subpipelines de $facet.

  • Aplica el tamaño máximo del documento para $facet después de procesar cada elemento.

  • Mejora el rendimiento para las etapas de $match.

  • Mejora los mensajes de error.

  • Mejora la estabilidad y el rendimiento.

  • Incluye soporte mejorado para Parquet.

  • Compatibles con los clústeres de Atlas M0, M2 y M5 como fuentes de datos.

  • Agregar opción de coincidencia de patrones regex para colecciones comodín de clústeres Atlas.

  • Incluye mensajes de error actualizados para el límite de ejecución de query.

  • Genera la configuración de almacenamiento automáticamente por primera vez después de la autenticación del usuario.

  • Retorna el ID de conexión a través del comando hello.

  • Soporta $geoNear en colecciones de Atlas Data Lake que abarcan varios clústeres de Atlas.

  • Incluye diversas mejoras de rendimiento.

  • Incluye mensajes de error mejorados para las consultas finalizadas.

  • Incluye nueva pantalla de integración y una interfaz de configuración de almacenamiento.

  • Mensaje de error del esquema SQL mejorado.

  • Soporte para la delegación de consultas a colecciones conformadas por varias colecciones de Atlas.

  • Mejora la estabilidad y el rendimiento.

  • Agrega un nuevo $sql formatVersion para reducir el tamaño de los datos del conjunto de resultados.

  • Mejora el rendimiento de $lookup Stage (Atlas Data Federation).

  • Agrega soporte para "verbosity": "queryPlannerExtended" al comando explain para filtrar particiones que no coinciden.

  • Agrega soporte para $$NOW.

  • Informe Atlas Data Lake como MongoDB versión 4.4 para herramientas.

  • Agrega soporte para la opción segundo plano en la etapa de agregación $out to Atlas.

  • Incluye mejoras en la estabilidad y el rendimiento.

  • Agrega la opción {background: true}, que permite que las consultas se ejecuten en segundo plano para $out a la etapa S3.

  • Introduce la etapa de agregación $queryHistory para ver las queries pasadas.

  • Incluye varias mejoras de rendimiento y estabilidad.

  • Admite formatos Parquet, CSV y TSV para $out a S3.

  • Agrega un límite rodante para los cursores.

  • Mejora los mensajes de error para los comandos que no se pueden analizar.

  • Admite defaultFormat para archivos en URLs accesibles públicamente en almacenes HTTP.

  • Limita la cantidad de queries simultáneas a 30 por cada instancia federada de base de datos.

  • Admite el formato de compresión bzip2.

  • Compatible con la opción comment para el comando aggregate.

  • Incluye varias mejoras de rendimiento y estabilidad.

  • Admite el comando killOp para finalizar una query de larga duración.

  • Agrega configuration para el número máximo de colecciones comodín para las instancias del almacén de la base de datos federada S3.

  • Mejoras en $out para el rendimiento de guardado en S3.

  • Incluye mejoras generales de rendimiento y estabilidad.

  • Agrega correlationID a la salida $currentOp.

  • Incluye mejoras generales de rendimiento y estabilidad.

  • Admite la etapa del pipeline de agregación $collStats.

  • Incluye optimizaciones de rendimiento para archivos ORC.

  • Incluye mejoras generales de rendimiento y estabilidad.

  • Agrega soporte para los campos skip y limit al comando count().
  • Agrega el comando storageValidateConfig para validar la configuración de almacenamientode tu instancia de base de datos federada.

  • Incluye correcciones de errores y mejoras de rendimiento.

  • Incluye mejoras generales de rendimiento y estabilidad.
  • Automatiza la generación de la configuración de almacenamiento para las instancias de bases de datos federadas recién creadas.

  • Permite guardar datos conscientes del particionamiento en S3 usando la $out en Data Federation.

  • Genera configuraciones de almacenamiento cuando Atlas crea una instancia federada de base de datos.

  • Añade soporte para $out a S3.

  • Actualiza el soporte para Apache Parquet elemento LIST.

  • Actualiza el soporte del protocolo de conexión a 4.2 desde 3.6.

  • Agrega compatibilidad para el nivel de verbosidad en el plan de explicación.

  • Soluciona problemas de estabilidad.
  • Mejora el rendimiento.

  • Admite la etapa $currentOp para que pueda supervisar el progreso de las queries de ejecución prolongada.

  • Actualiza el atributo isodate para aceptar formatos adicionales.

  • Actualiza el catálogo de metadatos cuando se utilizan los comandos de Configuración de almacenamiento.

  • Incluye varias mejoras de rendimiento y estabilidad.

  • Admite referencias de campos de nombre de archivo para $out.

  • Respalda $toString en $out a S3.

  • Admite otorgar opcionalmente acceso de escritura a la instancia federada de base de datos a los buckets S3, permitiendo el uso de $out semánticas para escribir directamente en esos buckets.

  • Agrega comandos incrementales de almacenar, base de datos, colección y view para la gestión de configuración de almacenamiento.

  • Limita las colecciones devueltas para colecciones de comodines a 1.000.

  • Actualiza el formato de configuración de almacenamiento.

  • Admite queries entre bases de datos $lookup.

  • Admite extensiones de archivo en minúsculas y mayúsculas.

  • Los segmentos de plantillas ahora admiten nombres de atributos separados por puntos que corresponden a campos anidados.

  • Permite que el defaultFormat se especifique sin un punto inicial.

  • Permite el filtrado en base a 'stripes' para archivos en formato ORC.

  • Permite que los atributos de query se extraigan después de la primera etapa.

  • Incluye varias mejoras de rendimiento y estabilidad.

  • Admite la definición de particiones para lo siguiente:

    • epoch_secs, que son segundos desde la Época Unix

    • epoch_millis, que son milisegundos desde la Unix epoch

    • UUIDque es el subtipo binario 4

  • Incluye varias mejoras de rendimiento y estabilidad.

  • Agrega soporte para la lectura de archivos Apache ORC.

  • Devuelve un error si una query produce un documento de más de 16 MiB.

  • La etapa $indexStats ahora produce una lista vacía de índices en lugar de un error.

  • Admite $out a formato de almacenamiento S3 en JSON.

  • $match ahora trata de forma implícita todos los términos como conjunciones.

  • Ya no analiza archivos vacíos.

  • Corregir un problema que causaba que la expresión {$match: {$expr: {$and: []}}} terminara la conexión.

  • Permite campos anidados en definiciones.de particiones.

  • Ya no enumera los directorios en S3 cuando se identifica un único subdirectorio que contiene todas las particiones que coinciden con la query.

  • Corrige un problema donde la nueva configuración de almacenamiento no aparecía en la conexión emisora después de ejecutar setStorageConfig.

  • Agrega soporte para el comando de base de datos getLastError.

  • Corrige un error en la forma en que se manejan los tipos de unión en Avro.

  • Soporta la $out etapa del pipeline de agregación para S3.

  • listIndexes now siempre devuelve una lista vacía.

  • Traduce claves de CSV y TSV delimitadas por puntos en subdocumentos.

  • El mensaje de error de configuración del almacenamiento ahora incluye un enlace a la documentación.

  • Es compatible con el formato de archivo XLSX.

  • Incluye el ID de correlación en los mensajes de error de ejecución de query.

  • Devuelve un error al cliente cuando se alcanza el límite de almacenamiento del cursor.

  • Devuelve un error al cliente en getMore final si se supera el límite de almacenamiento del cursor.

  • Admite listCommands. Por ejemplo: db.runCommand({"listCommands": 1})

  • Incluye información sobre el tamaño de la partición en el resultado de explain().

  • Devuelve el primer lote de resultados del cursor más rápidamente.

  • Mejora el rendimiento de $lookup cuando se combina con $unwind.

  • Soporta automáticamente SCRAM-SHA-1 credenciales sin requerir que los controladores especifiquen este mecanismo de autenticación.

  • Proporciona un mensaje de error descriptivo cuando se desconoce el formato del archivo.

  • Proporciona validación adicional en setStorageConfig.

Lanzamiento inicial de una vista previa pública de Atlas Data Federation.