Observação
Pipeline de Agregação como Alternativa à Redução de Mapa
Um pipeline de agregação fornece melhor desempenho e usabilidade do que uma operaçãode redução de mapa.
As operações de redução de mapa podem ser reescritas usando pipeline de agregação, como $group e $merge.
Para operações de map-reduce que exigem funcionalidade personalizada, o MongoDB fornece os operadores de agregação $accumulator e $function. Use esses operadores para definir expressões de agregação personalizadas no JavaScript.
No mongosh, o método db.collection.mapReduce() é um encapsulador do comando mapReduce. Os exemplos a seguir utilizam o método db.collection.mapReduce().
Os exemplos nesta seção incluem alternativas de aggregation pipelines sem expressões de agregação customizadas. Para alternativas que usam expressões personalizadas, consulte Exemplos de tradução do map-reduce para o aggregation pipeline.
Crie uma coleção de amostra orders com estes documentos:
db.orders.insertMany([    { _id: 1, cust_id: "Ant O. Knee", ord_date: new Date("2020-03-01"), price: 25, items: [ { sku: "oranges", qty: 5, price: 2.5 }, { sku: "apples", qty: 5, price: 2.5 } ], status: "A" },    { _id: 2, cust_id: "Ant O. Knee", ord_date: new Date("2020-03-08"), price: 70, items: [ { sku: "oranges", qty: 8, price: 2.5 }, { sku: "chocolates", qty: 5, price: 10 } ], status: "A" },    { _id: 3, cust_id: "Busby Bee", ord_date: new Date("2020-03-08"), price: 50, items: [ { sku: "oranges", qty: 10, price: 2.5 }, { sku: "pears", qty: 10, price: 2.5 } ], status: "A" },    { _id: 4, cust_id: "Busby Bee", ord_date: new Date("2020-03-18"), price: 25, items: [ { sku: "oranges", qty: 10, price: 2.5 } ], status: "A" },    { _id: 5, cust_id: "Busby Bee", ord_date: new Date("2020-03-19"), price: 50, items: [ { sku: "chocolates", qty: 5, price: 10 } ], status: "A"},    { _id: 6, cust_id: "Cam Elot", ord_date: new Date("2020-03-19"), price: 35, items: [ { sku: "carrots", qty: 10, price: 1.0 }, { sku: "apples", qty: 10, price: 2.5 } ], status: "A" },    { _id: 7, cust_id: "Cam Elot", ord_date: new Date("2020-03-20"), price: 25, items: [ { sku: "oranges", qty: 10, price: 2.5 } ], status: "A" },    { _id: 8, cust_id: "Don Quis", ord_date: new Date("2020-03-20"), price: 75, items: [ { sku: "chocolates", qty: 5, price: 10 }, { sku: "apples", qty: 10, price: 2.5 } ], status: "A" },    { _id: 9, cust_id: "Don Quis", ord_date: new Date("2020-03-20"), price: 55, items: [ { sku: "carrots", qty: 5, price: 1.0 }, { sku: "apples", qty: 10, price: 2.5 }, { sku: "oranges", qty: 10, price: 2.5 } ], status: "A" },    { _id: 10, cust_id: "Don Quis", ord_date: new Date("2020-03-23"), price: 25, items: [ { sku: "oranges", qty: 10, price: 2.5 } ], status: "A" } ]) 
Retornar o preço total por cliente
Execute a operação map-reduce na collection orders para agrupar pelo cust_id e calcule a soma do price para cada cust_id:
- Defina a função do mapa para processar cada documento de entrada: - Na função, o - thisrefere-se ao documento que a operação de redução de mapa está processando.
- A função mapeia o - pricepara o- cust_idpara cada documento e emite o- cust_ide- price.
 - var mapFunction1 = function() { - emit(this.cust_id, this.price); - }; 
- Defina a função de redução correspondente com dois argumentos - keyCustIde- valuesPrices:- O - valuesPricesé uma array cujos elementos são os valores- priceemitidos pela função de mapa e agrupados por- keyCustId.
- A função reduz a array - valuesPriceà soma de seus elementos.
 - var reduceFunction1 = function(keyCustId, valuesPrices) { - return Array.sum(valuesPrices); - }; 
- Executar a redução de mapa em todos os documentos na coleção do - ordersutilizando a função de mapa do- mapFunction1e a função de redução do- reduceFunction1:- db.orders.mapReduce( - mapFunction1, - reduceFunction1, - { out: "map_reduce_example" } - ) - Esta operação gera resultados para uma coleção denominada - map_reduce_example. Se a coleção- map_reduce_examplejá existir, a operação substituirá o conteúdo pelos resultados desta operação de redução de mapa.
- Consulte a coleção - map_reduce_examplepara verificar os resultados:- db.map_reduce_example.find().sort( { _id: 1 } ) - A operação retorna estes documentos: - { "_id" : "Ant O. Knee", "value" : 95 } - { "_id" : "Busby Bee", "value" : 125 } - { "_id" : "Cam Elot", "value" : 60 } - { "_id" : "Don Quis", "value" : 155 } 
Alternativa de aggregation
Usando os operadores de aggregation pipeline disponíveis, você pode reescrever a operação de map-reduce sem definir funções personalizadas:
db.orders.aggregate([    { $group: { _id: "$cust_id", value: { $sum: "$price" } } },    { $out: "agg_alternative_1" } ]) 
- O estágio - $groupagrupa pelo- cust_ide calcula o campo- value(consulte também- $sum). O campo- valuecontém o total de- pricepara cada- cust_id.- O estágio envia os seguintes documentos para o próximo estágio: - { "_id" : "Don Quis", "value" : 155 } - { "_id" : "Ant O. Knee", "value" : 95 } - { "_id" : "Cam Elot", "value" : 60 } - { "_id" : "Busby Bee", "value" : 125 } 
- Em seguida, o - $outgrava a saída na coleção- agg_alternative_1. Alternativamente, você pode utilizar- $mergeao invés de- $out.
- Consulte a coleção - agg_alternative_1para verificar os resultados:- db.agg_alternative_1.find().sort( { _id: 1 } ) - A operação retorna os seguintes documentos: - { "_id" : "Ant O. Knee", "value" : 95 } - { "_id" : "Busby Bee", "value" : 125 } - { "_id" : "Cam Elot", "value" : 60 } - { "_id" : "Don Quis", "value" : 155 } 
Dica
Para obter uma alternativa que usa expressões de agregação personalizadas, consulte Map-Reduce to Aggregation Pipeline Translation Examples.
Calcule o pedido e a quantidade total com a quantidade média por item
No exemplo seguinte, você visualizará uma operação de map-reduce na collection orders para todos os documentos que têm um valor ord_date maior ou igual a 2020-03-01.
A operação no exemplo:
- Agrupa pelo campo - item.skue calcula o número de pedidos e a quantidade total solicitada para cada- sku.
- Calcula a quantidade média por pedido para cada valor - skue mescla os resultados na coleta de saída.
Ao mesclar resultados, se um documento existente tiver a mesma chave que o novo resultado, a operação substituirá o documento existente. Se não houver nenhum documento existente com a mesma chave, a operação inserirá o documento.
Etapas de exemplo:
- Defina a função do mapa para processar cada documento de entrada: - Na função, o - thisrefere-se ao documento que a operação de redução de mapa está processando.
- Para cada item, a função associa o - skua um novo objeto- valueque contém o- countde- 1e o item- qtypara o pedido e emite o- sku(armazenado no- key) e o- value.
 - var mapFunction2 = function() { - for (var idx = 0; idx < this.items.length; idx++) { - var key = this.items[idx].sku; - var value = { count: 1, qty: this.items[idx].qty }; - emit(key, value); - } - }; 
- Defina a função de redução correspondente com dois argumentos - keySKUe- countObjVals:- countObjValsé uma matriz cujos elementos são os objetos mapeados para os valores agrupados do- keySKUpassados pela função de mapa para a função redutor.
- A função reduz a matriz - countObjValspara um único objeto- reducedValueque contém os campos- counte- qty.
- Em - reducedVal, o campo- countcontém a soma dos campos- countdos elementos individuais da array e o campo- qtycontém a soma dos campos- qtydos elementos individuais da array.
 - var reduceFunction2 = function(keySKU, countObjVals) { - reducedVal = { count: 0, qty: 0 }; - for (var idx = 0; idx < countObjVals.length; idx++) { - reducedVal.count += countObjVals[idx].count; - reducedVal.qty += countObjVals[idx].qty; - } - return reducedVal; - }; 
- Defina uma função de finalização com dois argumentos - keye- reducedVal. A função modifica o objeto- reducedValpara adicionar um campo calculado denominado- avge retorna o objeto modificado:- var finalizeFunction2 = function (key, reducedVal) { - reducedVal.avg = reducedVal.qty/reducedVal.count; - return reducedVal; - }; 
- Execute a operação de redução de mapa na coleção do - ordersutilizando as funções- mapFunction2,- reduceFunction2e- finalizeFunction2:- db.orders.mapReduce( - mapFunction2, - reduceFunction2, - { - out: { merge: "map_reduce_example2" }, - query: { ord_date: { $gte: new Date("2020-03-01") } }, - finalize: finalizeFunction2 - } - ); - Esta operação utiliza o campo - querypara selecionar apenas os documentos com- ord_datemaior ou igual a- new Date("2020-03-01"). Em seguida, ele envia os resultados para uma coleção- map_reduce_example2.- Se a coleção - map_reduce_example2já existir, a operação fundirá o conteúdo existente com os resultados desta operação de redução de mapa. Ou seja, se um documento existente tiver a mesma chave que o novo resultado, a operação substituirá o documento existente. Se não houver nenhum documento existente com a mesma chave, a operação inserirá o documento.
- Consulte a coleção - map_reduce_example2para verificar os resultados:- db.map_reduce_example2.find().sort( { _id: 1 } ) - A operação retorna estes documentos: - { "_id" : "apples", "value" : { "count" : 4, "qty" : 35, "avg" : 8.75 } } - { "_id" : "carrots", "value" : { "count" : 2, "qty" : 15, "avg" : 7.5 } } - { "_id" : "chocolates", "value" : { "count" : 3, "qty" : 15, "avg" : 5 } } - { "_id" : "oranges", "value" : { "count" : 7, "qty" : 63, "avg" : 9 } } - { "_id" : "pears", "value" : { "count" : 1, "qty" : 10, "avg" : 10 } } 
Alternativa de aggregation
Usando os operadores de aggregation pipeline disponíveis, você pode reescrever a operação de map-reduce sem definir funções personalizadas:
db.orders.aggregate( [    { $match: { ord_date: { $gte: new Date("2020-03-01") } } },    { $unwind: "$items" },    { $group: { _id: "$items.sku", qty: { $sum: "$items.qty" }, orders_ids: { $addToSet: "$_id" } }  },    { $project: { value: { count: { $size: "$orders_ids" }, qty: "$qty", avg: { $divide: [ "$qty", { $size: "$orders_ids" } ] } } } },    { $merge: { into: "agg_alternative_3", on: "_id", whenMatched: "replace",  whenNotMatched: "insert" } } ] ) 
- A etapa - $matchseleciona apenas os documentos com- ord_datemaior ou igual a- new Date("2020-03-01").
- O estágio - $unwinddivide o documento pelo campo de array- itemspara gerar um documento para cada elemento da array. Por exemplo:- { "_id" : 1, "cust_id" : "Ant O. Knee", "ord_date" : ISODate("2020-03-01T00:00:00Z"), "price" : 25, "items" : { "sku" : "oranges", "qty" : 5, "price" : 2.5 }, "status" : "A" } - { "_id" : 1, "cust_id" : "Ant O. Knee", "ord_date" : ISODate("2020-03-01T00:00:00Z"), "price" : 25, "items" : { "sku" : "apples", "qty" : 5, "price" : 2.5 }, "status" : "A" } - { "_id" : 2, "cust_id" : "Ant O. Knee", "ord_date" : ISODate("2020-03-08T00:00:00Z"), "price" : 70, "items" : { "sku" : "oranges", "qty" : 8, "price" : 2.5 }, "status" : "A" } - { "_id" : 2, "cust_id" : "Ant O. Knee", "ord_date" : ISODate("2020-03-08T00:00:00Z"), "price" : 70, "items" : { "sku" : "chocolates", "qty" : 5, "price" : 10 }, "status" : "A" } - { "_id" : 3, "cust_id" : "Busby Bee", "ord_date" : ISODate("2020-03-08T00:00:00Z"), "price" : 50, "items" : { "sku" : "oranges", "qty" : 10, "price" : 2.5 }, "status" : "A" } - { "_id" : 3, "cust_id" : "Busby Bee", "ord_date" : ISODate("2020-03-08T00:00:00Z"), "price" : 50, "items" : { "sku" : "pears", "qty" : 10, "price" : 2.5 }, "status" : "A" } - { "_id" : 4, "cust_id" : "Busby Bee", "ord_date" : ISODate("2020-03-18T00:00:00Z"), "price" : 25, "items" : { "sku" : "oranges", "qty" : 10, "price" : 2.5 }, "status" : "A" } - { "_id" : 5, "cust_id" : "Busby Bee", "ord_date" : ISODate("2020-03-19T00:00:00Z"), "price" : 50, "items" : { "sku" : "chocolates", "qty" : 5, "price" : 10 }, "status" : "A" } - ... 
- Os - $groupgrupos de estágio pelo- items.sku, calculando para cada sku:- O campo qty. O campoqtycontém o
- total qtysolicitado por cadaitems.sku(consulte$sum).
 
- O campo 
- A matriz orders_ids. O campoorders_idscontém um
- array de _idde ordem distinta para oitems.sku(veja$addToSet).
 
- A matriz 
 - { "_id" : "chocolates", "qty" : 15, "orders_ids" : [ 2, 5, 8 ] } - { "_id" : "oranges", "qty" : 63, "orders_ids" : [ 4, 7, 3, 2, 9, 1, 10 ] } - { "_id" : "carrots", "qty" : 15, "orders_ids" : [ 6, 9 ] } - { "_id" : "apples", "qty" : 35, "orders_ids" : [ 9, 8, 1, 6 ] } - { "_id" : "pears", "qty" : 10, "orders_ids" : [ 3 ] } 
- O estágio - $projectremodela o documento de saída para espelhar a saída do map-reduce para ter dois campos- _ide- value. Os conjuntos- $project:
- O estágio - $unwinddivide o documento pelo campo de array- itemspara gerar um documento para cada elemento da array. Por exemplo:- { "_id" : 1, "cust_id" : "Ant O. Knee", "ord_date" : ISODate("2020-03-01T00:00:00Z"), "price" : 25, "items" : { "sku" : "oranges", "qty" : 5, "price" : 2.5 }, "status" : "A" } - { "_id" : 1, "cust_id" : "Ant O. Knee", "ord_date" : ISODate("2020-03-01T00:00:00Z"), "price" : 25, "items" : { "sku" : "apples", "qty" : 5, "price" : 2.5 }, "status" : "A" } - { "_id" : 2, "cust_id" : "Ant O. Knee", "ord_date" : ISODate("2020-03-08T00:00:00Z"), "price" : 70, "items" : { "sku" : "oranges", "qty" : 8, "price" : 2.5 }, "status" : "A" } - { "_id" : 2, "cust_id" : "Ant O. Knee", "ord_date" : ISODate("2020-03-08T00:00:00Z"), "price" : 70, "items" : { "sku" : "chocolates", "qty" : 5, "price" : 10 }, "status" : "A" } - { "_id" : 3, "cust_id" : "Busby Bee", "ord_date" : ISODate("2020-03-08T00:00:00Z"), "price" : 50, "items" : { "sku" : "oranges", "qty" : 10, "price" : 2.5 }, "status" : "A" } - { "_id" : 3, "cust_id" : "Busby Bee", "ord_date" : ISODate("2020-03-08T00:00:00Z"), "price" : 50, "items" : { "sku" : "pears", "qty" : 10, "price" : 2.5 }, "status" : "A" } - { "_id" : 4, "cust_id" : "Busby Bee", "ord_date" : ISODate("2020-03-18T00:00:00Z"), "price" : 25, "items" : { "sku" : "oranges", "qty" : 10, "price" : 2.5 }, "status" : "A" } - { "_id" : 5, "cust_id" : "Busby Bee", "ord_date" : ISODate("2020-03-19T00:00:00Z"), "price" : 50, "items" : { "sku" : "chocolates", "qty" : 5, "price" : 10 }, "status" : "A" } - ... 
- Os - $groupgrupos de estágio pelo- items.sku, calculando para cada sku:- O campo - qty. O campo- qtycontém o total de- qtyordenados por cada- items.skuutilizando- $sum.
- A array - orders_ids. O campo- orders_idscontém uma array de ordem distinta- _idpara o- items.skuutilizando- $addToSet.
 - { "_id" : "chocolates", "qty" : 15, "orders_ids" : [ 2, 5, 8 ] } - { "_id" : "oranges", "qty" : 63, "orders_ids" : [ 4, 7, 3, 2, 9, 1, 10 ] } - { "_id" : "carrots", "qty" : 15, "orders_ids" : [ 6, 9 ] } - { "_id" : "apples", "qty" : 35, "orders_ids" : [ 9, 8, 1, 6 ] } - { "_id" : "pears", "qty" : 10, "orders_ids" : [ 3 ] } 
- O estágio - $projectremodela o documento de saída para espelhar a saída do map-reduce para ter dois campos- _ide- value. Os conjuntos- $project:- o - value.countpara o tamanho da array- orders_idsusando- $size.
- o - value.qtypara o campo- qtydo documento de entrada.
- o - value.avgpara o número médio de quantidade por pedido usando- $dividee- $size.
 - { "_id" : "apples", "value" : { "count" : 4, "qty" : 35, "avg" : 8.75 } } - { "_id" : "pears", "value" : { "count" : 1, "qty" : 10, "avg" : 10 } } - { "_id" : "chocolates", "value" : { "count" : 3, "qty" : 15, "avg" : 5 } } - { "_id" : "oranges", "value" : { "count" : 7, "qty" : 63, "avg" : 9 } } - { "_id" : "carrots", "value" : { "count" : 2, "qty" : 15, "avg" : 7.5 } } 
- Finalmente, o - $mergegrava a saída na coleção- agg_alternative_3. Se um documento existente tiver a mesma chave- _idque o novo resultado, a operação substituirá o documento existente. Se não houver nenhum documento existente com a mesma chave, a operação inserirá o documento.
- Consulte a coleção - agg_alternative_3para verificar os resultados:- db.agg_alternative_3.find().sort( { _id: 1 } ) - A operação retorna os seguintes documentos: - { "_id" : "apples", "value" : { "count" : 4, "qty" : 35, "avg" : 8.75 } } - { "_id" : "carrots", "value" : { "count" : 2, "qty" : 15, "avg" : 7.5 } } - { "_id" : "chocolates", "value" : { "count" : 3, "qty" : 15, "avg" : 5 } } - { "_id" : "oranges", "value" : { "count" : 7, "qty" : 63, "avg" : 9 } } - { "_id" : "pears", "value" : { "count" : 1, "qty" : 10, "avg" : 10 } } 
Dica
Para obter uma alternativa que usa expressões de agregação personalizadas, consulte Map-Reduce to Aggregation Pipeline Translation Examples.