Definición
$accumulatorDefine un operador de acumulación. Los acumuladores son operadores que mantienen su estado (por ejemplo, totales, máximos, mínimos y datos relacionados) a medida que los documentos avanzan por el pipeline. Utilizar el
$accumulatoroperador para ejecutar tus propias funciones JavaScript para implementar un comportamiento no soportado por el languaje del query de MongoDB. Véase también$function.$accumulatorestá disponible en estas etapas:Importante
La ejecución de JavaScript dentro de un operador de agregación puede disminuir el rendimiento. Utilice solo el operador
$accumulatorsi los operadores de pipeline proporcionados no pueden satisfacer las necesidades de su aplicación.
Sintaxis
El operador $accumulator tiene esta sintaxis:
{ $accumulator: { init: <code>, initArgs: <array expression>, // Optional accumulate: <code>, accumulateArgs: <array expression>, merge: <code>, finalize: <code>, // Optional lang: <string> } }
Campo | Tipo | Descripción | ||||
|---|---|---|---|---|---|---|
string o código | Función utilizada para inicializar el estado. La función La función Derramar en el disco o ejecutar una query en un clúster fragmentado puede hacer que el acumulador se calcule como una fusión de varias subacumulaciones, cada una de las cuales comienza llamando a | |||||
Arreglo | opcional. Argumentos pasados a la función
IMPORTANTE: Cuando se use en una | |||||
string o código | Función utilizada para acumular documentos. La función La función | |||||
Arreglo | Argumentos pasados a la función
| |||||
string o código | Función utilizada para fusionar dos estados internos. La función | |||||
string o código | opcional. Función utilizada para actualizar el resultado del acumulador. La función | |||||
String | El lenguaje utilizado en el código IMPORTANTE: Actualmente, el único valor admitido para |
Comportamiento
Los siguientes pasos describen cómo el operador $accumulator procesa los documentos:
El operador comienza en un estado inicial, definido por la función init.
Para cada documento, el operador actualiza el estado según la función accumulate. El primer argumento de la función accumulate es el estado actual, y se pueden especificar argumentos adicionales en el arreglo accumulateArgs.
Cuando el operador necesita fusionar varios estados intermedios, ejecuta la función merge. Para obtener más información sobre cuándo se llama a la función de fusión, consulte Fusionar dos estados con
$merge.Si se ha definido una función finalizar, una vez que se hayan procesado todos los documentos y se haya actualizado el estado en consecuencia, finalizar convierte el estado en una salida final.
Combinar dos estados con $merge
Como parte de sus operaciones internas, el operador $accumulator puede necesitar fusionar dos estados intermedios separados. La función merge especifica cómo el operador debe fusionar dos estados.
La función merge siempre combina dos estados a la vez. En el evento de que haya que combinar más de dos estados, la combinación resultante de dos estados se combina con un único estado. Este proceso se repite hasta que se combinan todos los estados.
Por ejemplo, $accumulator puede necesitar combinar dos estados en los siguientes escenarios:
$accumulatorSe ejecuta en un clúster fragmentado. El operador necesita fusionar los resultados de cada partición para obtener el resultado final.Una sola operación de
$accumulatorsupera su límite de memoria especificado. Si especifica la opciónallowDiskUse, el operador almacena la operación en curso en disco y termina la operación en memoria. Una vez que la operación finalice, los resultados del disco y la memoria se fusionan utilizando la función merge.
Orden de Procesamiento de Documentos
El orden con el que MongoDB procesa documentos para las funciones init(), accumulate() y merge() puede variar y podría diferir del orden en que esos documentos se especifican para la función $accumulator.
Por ejemplo, considera una serie de documentos donde los campos _id son las letras del alfabeto:
{ _id: 'a' }, { _id: 'b' }, { _id: 'c' } ... { _id: 'z' }
A continuación, considere un pipeline de agregación que ordena los documentos por el campo _id y luego utiliza una función $accumulator para concatenar los valores del campo _id:
[ { $sort: { _id: 1 } }, { $group: { _id: null, alphabet: { $accumulator: { init: function() { return "" }, accumulate: function(state, letter) { return(state + letter) }, accumulateArgs: [ "$_id" ], merge: function(state1, state2) { return(state1 + state2) }, lang: "js" } } } } ]
MongoDB no garantiza que los documentos se procesen en orden clasificado, lo que significa que el campo alphabet no necesariamente se establecerá en abc...z.
Debido a este comportamiento, asegúrate de que tu función $accumulator no necesite procesar y retornar documentos en un orden específico.
Javascript habilitado
Para usar $accumulator, debes habilitar el script del lado del servidor.
Si no utilizas $accumulator (o $function, $where o mapReduce), desactiva los scripts en el lado del servidor:
Para una instancia de
mongod, consulta la opción de configuraciónsecurity.javascriptEnabledo la opción de línea de comandos--noscripting.Para una instancia
mongos, consulta la opción de configuraciónsecurity.javascriptEnabledo la opción de línea de comandos--noscripting.In earlier versions, MongoDB does not allow JavaScript execution onmongosinstances.
Consulta también ➤ Ejecutar MongoDB con opciones de configuración seguras.
Funciones de string y arreglo no compatibles
MongoDB 6.0 mejora el motor interno JavaScript utilizado para JavaScript del lado del servidor, $accumulator, $function, y $where expresiones y de MozJS-60 a MozJS-91. Varias funciones de arreglos y strings obsoletas y no estándar que existían en MozJS-60 se eliminan en MozJS-91.
Ejemplos
Utiliza $accumulator para implementar el $avg operador
Nota
Este ejemplo muestra cómo utilizar el operador $accumulator para implementar el operador $avg que ya admite MongoDB. El objetivo de este ejemplo no es implementar una nueva funcionalidad, sino ilustrar el comportamiento y la sintaxis del operador $accumulator con una lógica familiar.
En mongosh, cree una colección de muestra llamada books con los siguientes documentos:
db.books.insertMany([ { _id: 8751, title: "The Banquet", author: "Dante", copies: 2 }, { _id: 8752, title: "Divine Comedy", author: "Dante", copies: 1 }, { _id: 8645, title: "Eclogues", author: "Dante", copies: 2 }, { _id: 7000, title: "The Odyssey", author: "Homer", copies: 10 }, { _id: 7020, title: "Iliad", author: "Homer", copies: 10 } ])
La siguiente operación groups los documentos por author, y utiliza $accumulator para calcular el número promedio de copias en libros para cada autor:
db.books.aggregate([ { $group : { _id : "$author", avgCopies: { $accumulator: { init: function() { // Set the initial state return { count: 0, sum: 0 } }, accumulate: function(state, numCopies) { // Define how to update the state return { count: state.count + 1, sum: state.sum + numCopies } }, accumulateArgs: ["$copies"], // Argument required by the accumulate function merge: function(state1, state2) { // When the operator performs a merge, return { // add the fields from the two states count: state1.count + state2.count, sum: state1.sum + state2.sum } }, finalize: function(state) { // After collecting the results from all documents, return (state.sum / state.count) // calculate the average }, lang: "js" } } } } ])
Resultado
Esta operación devuelve el siguiente resultado:
{ _id: "Dante", avgCopies: 1.6666666666666667 } { _id: "Homer", avgCopies: 10 }
Comportamiento
$accumulator define un estado inicial donde count y sum están ambos configurados a 0. Para cada documento que procesa el $accumulator, este actualiza el estado mediante:
Incrementando el
countpor 1 yAgregar los valores del campo
copiesdel documento alsum. La función accumulate puede acceder al campocopiesporque se pasa en el campo accumulateArgs.
Con cada documento que se procesa, la función acumular devuelve el estado actualizado.
Una vez que todos los documentos hayan sido procesados, la función finalizar divide sum de las copias por count de los documentos para obtener el promedio. Esto remueve la necesidad de mantener un promedio calculado en tiempo real, ya que la función finalizar recibe el sum y count acumulados de todos los documentos.
Comparación con $avg
Esta operación es equivalente al siguiente pipeline, que utiliza el operador $avg:
db.books.aggregate([ { $group : { _id : "$author", avgCopies: { $avg: "$copies" } } } ])
Usa initArgs para variar el estado inicial por grupo
Puedes utilizar la opción initArgs para variar el estado inicial de $accumulator. Esto puede ser útil si, por ejemplo, desea:
Utilice el valor de un campo que no esté en su estado para afectar su estado, o
Establece el estado inicial a un valor diferente según el grupo que se procese.
En mongosh, cree una colección de muestra llamada restaurants con los siguientes documentos:
db.restaurants.insertMany( [ { _id: 1, name: "Food Fury", city: "Bettles", cuisine: "American" }, { _id: 2, name: "Meal Macro", city: "Bettles", cuisine: "Chinese" }, { _id: 3, name: "Big Crisp", city: "Bettles", cuisine: "Latin" }, { _id: 4, name: "The Wrap", city: "Onida", cuisine: "American" }, { _id: 5, name: "Spice Attack", city: "Onida", cuisine: "Latin" }, { _id: 6, name: "Soup City", city: "Onida", cuisine: "Chinese" }, { _id: 7, name: "Crave", city: "Pyote", cuisine: "American" }, { _id: 8, name: "The Gala", city: "Pyote", cuisine: "Chinese" } ] )
Suponga que una aplicación permite a los usuarios query estos datos para encontrar restaurantes. Puede ser útil mostrar más resultados para la ciudad donde vive el usuario. Para este ejemplo, asumimos que la ciudad del usuario se almacena en una variable llamada userProfileCity.
La siguiente groups pipeline de agregación los documentos por city. La operación utiliza el $accumulator para mostrar un número diferente de resultados de cada ciudad, dependiendo de si la ciudad del restaurante coincide con la ciudad en el perfil del usuario:
Nota
1 db.restaurants.aggregate([ 2 { 3 $group : 4 { 5 _id : { city: "$city" }, 6 restaurants: 7 { 8 $accumulator: 9 { 10 init: function(city, userProfileCity) { // Set the initial state 11 return { 12 max: city === userProfileCity ? 3 : 1, // If the group matches the user's city, return 3 restaurants 13 restaurants: [] // else, return 1 restaurant 14 } 15 }, 16 17 initArgs: ["$city", <userProfileCity>], // Argument to pass to the init function 18 19 accumulate: function(state, restaurantName) { // Define how to update the state 20 if (state.restaurants.length < state.max) { 21 state.restaurants.push(restaurantName); 22 } 23 return state; 24 }, 25 26 accumulateArgs: ["$name"], // Argument required by the accumulate function 27 28 merge: function(state1, state2) { 29 return { 30 max: state1.max, 31 restaurants: state1.restaurants.concat(state2.restaurants).slice(0, state1.max) 32 } 33 }, 34 35 finalize: function(state) { // Adjust the state to only return field we need 36 return state.restaurants 37 } 38 39 lang: "js" 40 } 41 } 42 } 43 } 44 ])
Resultados
Si el valor de userProfileCity es Bettles, esta operación arroja el siguiente resultado:
{ _id: { city: "Bettles" }, restaurants: { restaurants: [ "Food Fury", "Meal Macro", "Big Crisp" ] } } { _id: { city: "Onida" }, restaurants: { restaurants: [ "The Wrap" ] } } { _id: { city: "Pyote" }, restaurants: { restaurants: [ "Crave" ] } }
Si el valor de userProfileCity es Onida, esta operación arroja el siguiente resultado:
{ _id: { city: "Bettles" }, restaurants: { restaurants: [ "Food Fury" ] } } { _id: { city: "Onida" }, restaurants: { restaurants: [ "The Wrap", "Spice Attack", "Soup City" ] } } { _id: { city: "Pyote" }, restaurants: { restaurants: [ "Crave" ] } }
Si el valor de userProfileCity es Pyote, esta operación arroja el siguiente resultado:
{ _id: { city: "Bettles" }, restaurants: { restaurants: [ "Food Fury" ] } } { _id: { city: "Onida" }, restaurants: { restaurants: [ "The Wrap" ] } } { _id: { city: "Pyote" }, restaurants: { restaurants: [ "Crave", "The Gala" ] } }
Si el valor de userProfileCity es cualquier otro valor, esta operación devuelve el siguiente resultado:
{ _id: { city: "Bettles" }, restaurants: { restaurants: [ "Food Fury" ] } } { _id: { city: "Onida" }, restaurants: { restaurants: [ "The Wrap" ] } } { _id: { city: "Pyote" }, restaurants: { restaurants: [ "Crave" ] } }
Comportamiento
La función init define un estado inicial que contiene max y restaurants campos. El campo max establece la cantidad máxima de restaurantes para ese grupo en particular. Si el campo city del documento coincide con userProfileCity, ese grupo contiene un máximo de 3 restaurantes. De lo contrario, si el documento _id no coincide con userProfileCity, el grupo contiene como máximo un solo restaurante. La función init recibe ambos argumentos city userProfileCity del initArgs arreglo.
Para cada documento que $accumulator procesa, se inserta el name del restaurante en el arreglo restaurants, siempre que ese nombre no exceda la longitud de restaurants respecto al valor max. Con cada documento que se procesa, la función acumular retorna el estado actualizado.
La función merge define cómo fusionar dos estados. La función concatena los restaurant arreglos de cada estado, y la longitud del arreglo resultante se limita usando el slice() método para asegurarse de que no supere el valor de max.
Una vez procesados todos los documentos, la función de finalización modifica el estado resultante para que solo devuelva los nombres de los restaurantes. Sin esta función, el campo max también se incluiría en el resultado, lo que no satisface ninguna necesidad de la aplicación.