Overview
Esta guía le muestra cómo utilizar el controlador Scala para realizar una operación de escritura masiva que realiza múltiples cambios en sus datos en una sola llamada a la base de datos.
Considera un escenario en el que quieres insertar un documento, actualizar varios otros documentos y luego borrar un documento. Si utiliza métodos individuales, cada operación requiere su propia llamada a la base de datos.
Al usar una operación de escritura masiva, puede realizar varias operaciones de escritura con menos llamadas a la base de datos. Puede realizar operaciones de escritura masiva en los siguientes niveles:
Colección: Puedes utilizar la
MongoCollection.bulkWrite()Método para realizar operaciones de escritura masiva en una sola colección. En este método, cada tipo de operación de escritura requiere al menos una llamada a la base de datos. Por ejemplo,MongoCollection.bulkWrite()integra varias operaciones de actualización en una sola llamada, pero realiza dos llamadas independientes a la base de datos para una operación de inserción y otra de reemplazo.Cliente: Si su aplicación se conecta a MongoDB Server versión 8.0 o posterior, puede usar el
MongoClient.bulkWrite()método para realizar operaciones de escritura masiva en varias colecciones y bases de datos del mismo clúster. Este método realiza todas las operaciones de escritura en una sola llamada a la base de datos.
Colección Escritura masiva
Las operaciones de escritura en bloque contienen una o más operaciones de escritura. Para realizar una operación de guardar masiva a nivel de colección, pasa un Seq de WriteModel documentos al método MongoCollection.bulkWrite(). Un WriteModel es un modelo que representa una operación de escritura.
Para cada operación de escritura que desee realizar, cree una instancia de una de las siguientes clases que heredan de WriteModel:
InsertOneModelUpdateOneModelUpdateManyModelReplaceOneModelDeleteOneModelDeleteManyModel
Luego, pase una lista de estas instancias al método bulkWrite().
Las siguientes secciones muestran cómo crear y usar instancias de las clases anteriores. La sección "Realizar la operación masiva" muestra cómo pasar una lista de modelos al bulkWrite() método para realizar la operación masiva.
Datos de muestra
Los ejemplos de esta sección utilizan la restaurants colección sample_restaurants de la base de datos de los conjuntos de datos de muestra de Atlas. Para acceder a esta colección desde su aplicación Scala, cree un MongoClient que se conecte a un clúster de Atlas y asigne los siguientes valores a database las collection variables y:
val database: MongoDatabase = mongoClient.getDatabase("sample_restaurants") val collection: MongoCollection[Document] = database.getCollection("restaurants")
Para aprender cómo crear un clúster gratuito de MongoDB Atlas y cargar los conjuntos de datos de muestra, consulte la guía de introducción a MongoDB.
Operaciones de inserción
Para realizar una operación de inserción, cree una instancia InsertOneModel y especifique el documento que desea insertar.
El siguiente ejemplo crea una instancia de InsertOneModel:
val insertOneModel = InsertOneModel( Document("name" -> "Blue Moon Grill", "borough" -> "Brooklyn", "cuisine" -> "American") )
Para insertar varios documentos, cree una instancia de InsertOneModel para cada documento.
Importante
Al realizar una operación masiva, el InsertOneModel no puede insertar un documento con un _id ya existente en la colección. En este caso, el controlador lanza un MongoBulkWriteException.
Operaciones de actualizar
Para actualizar un documento, crea una instancia de UpdateOneModel y pasa los siguientes argumentos:
Filtro de consulta que especifica los criterios utilizados para buscar coincidencias en los documentos de su colección.
Operación de actualización que desea realizar. Para obtener más información sobre las operaciones de actualización, consulte la guía "Operadores de actualización de campos" en el manual de MongoDB Server.
El siguiente ejemplo crea una instancia de UpdateOneModel:
val updateOneFilter = equal("name", "White Horse Tavern") val updateOneDoc = set("borough", "Queens") val updateOneModel = UpdateOneModel(updateOneFilter, updateOneDoc)
Si varios documentos coinciden con el filtro de consulta especificado en la instancia UpdateOneModel, la operación actualiza el primer resultado. Puede especificar una ordenación en una instancia UpdateOptions para aplicar un orden a los documentos coincidentes antes de que el controlador realice la operación de actualización, como se muestra en el siguiente código:
val options = UpdateOptions.sort(ascending("name"))
Para actualizar varios documentos, cree una instancia de UpdateManyModel y pase los mismos argumentos que para UpdateOneModel. La UpdateManyModel clase especifica actualizaciones para todos los documentos que coinciden con su filtro de query.
El siguiente ejemplo crea una instancia de UpdateManyModel:
val updateManyFilter = equal("name", "Wendy's") val updateManyDoc = set("cuisine", "Fast food") val updateManyModel = UpdateManyModel(updateManyFilter, updateManyDoc)
Reemplazar operaciones
Una operación de reemplazo elimina todos los campos y valores de un documento específico y los reemplaza con los nuevos campos y valores que usted especifique. Para realizar una operación de reemplazo, cree una instancia de ReplaceOneModel y pase los siguientes argumentos:
Filtro de consulta que especifica los criterios utilizados para buscar coincidencias en los documentos de su colección
Documento de reemplazo que especifica los nuevos campos y valores a insertar
El siguiente ejemplo crea una instancia de ReplaceOneModel:
val replaceFilter = equal("name", "Cooper Town Diner") val replaceDoc = Document("name" -> "Smith Town Diner", "borough" -> "Brooklyn", "cuisine" -> "American") val replaceOneModel = ReplaceOneModel(replaceFilter, replaceDoc)
Si varios documentos coinciden con el filtro de consulta especificado en la instancia ReplaceOneModel, la operación reemplaza el primer resultado. Puede especificar una ordenación en una instancia ReplaceOptions para aplicar un orden a los documentos coincidentes antes de que el controlador realice la operación de reemplazo, como se muestra en el siguiente código:
val options = ReplaceOptions.sort(ascending("name"))
Tip
Reemplazar varios documentos
Para reemplazar varios documentos, cree una instancia de ReplaceOneModel para cada documento.
Operaciones de borrar
Para borrar un documento, crea una instancia de DeleteOneModel y pasa un filtro de query que especifique el documento que deseas borrar. Una instancia DeleteOneModel proporciona instrucciones para eliminar solo el primer documento que coincida con tu filtro de query.
El siguiente ejemplo crea una instancia de DeleteOneModel:
val deleteOneModel = DeleteOneModel(equal("name", "Morris Park Bake Shop"))
Para eliminar varios documentos, cree una instancia de DeleteManyModel y utilice un filtro de consulta que especifique el documento que desea eliminar. Una instancia de DeleteManyModel proporciona instrucciones para eliminar todos los documentos que coincidan con su filtro de consulta.
El siguiente ejemplo crea una instancia de DeleteManyModel:
val deleteManyModel = DeleteManyModel(equal("cuisine", "Experimental"))
Realizar la operación masiva
Después de definir una instancia de modelo para cada operación que desee realizar, pase una instancia Seq que contenga los modelos al método MongoCollection.bulkWrite(). De forma predeterminada, el método ejecuta las operaciones en el orden especificado por la lista de modelos.
El siguiente ejemplo realiza múltiples operaciones de escritura utilizando el método bulkWrite():
val insertOneModel = InsertOneModel( Document("name" -> "Red's Pizza", "borough" -> "Brooklyn", "cuisine" -> "Pizzeria") ) val updateOneModel = UpdateOneModel(equal("name", "Moonlit Tavern"), set("borough", "Queens")) val deleteManyModel = DeleteManyModel(equal("name", "Crepe")) val writes = Seq(insertOneModel, updateOneModel, deleteManyModel) val observable = collection.bulkWrite(writes) observable.subscribe( (result: BulkWriteResult) => println(s"Success: $result"), (error: Throwable) => println(s"Error: ${error.getMessage}"), () => println("Completed") )
Success: AcknowledgedBulkWriteResult{insertedCount=1, matchedCount=1, removedCount=1, modifiedCount=1, upserts=[], inserts=[BulkWriteInsert{index=0, id=BsonObjectId{value=...}}]} Completed
Si alguna de las operaciones de escritura falla, el controlador Scala genera un BulkWriteError y no realiza ninguna operación adicional. BulkWriteError proporciona un elemento details que incluye la operación que falló y detalles sobre la excepción.
Nota
Cuando el controlador ejecuta una operación masiva, utiliza la preocupación de escritura de la colección de destino. El controlador informa todos los errores de preocupación de escritura después de intentar todas las operaciones, independientemente del orden de ejecución.
Personalizar escritura masiva
El método MongoCollection.bulkWrite() acepta opcionalmente un parámetro BulkWriteOptions, que especifica las opciones que se pueden usar para configurar la operación de escritura masiva. Si no se especifica ninguna opción, el controlador realiza la operación masiva con la configuración predeterminada. Para modificar el comportamiento de la operación de escritura, pase la instancia de la clase como último argumento del método bulkWrite().
La siguiente tabla describe los métodos de configuración que puede utilizar para configurar una instancia BulkWriteOptions:
Método | Descripción |
|---|---|
| If true, the driver performs the write operations in the order
provided. If an error occurs, the remaining operations are not
attempted.If false, the driver performs the operations in an
arbitrary order and attempts to perform all operations.Defaults to true. |
| Specifies whether the update operation bypasses document validation. This lets you
update documents that don't meet the schema validation requirements, if any
exist. For more information about schema validation, see Schema
Validation in the MongoDB
Server manual. Defaults to false. |
| Sets a comment to attach to the operation. |
| Provides a map of parameter names and values to set top-level
variables for the operation. Values must be constant or closed
expressions that don't reference document fields. |
El siguiente código crea opciones y establece la opción ordered en false para especificar una escritura masiva desordenada. Luego, el ejemplo usa el método bulkWrite() para realizar una operación masiva:
val options = BulkWriteOptions().ordered(false) val observable = collection.bulkWrite(writes, options)
Si alguna de las operaciones de escritura en una escritura en bloque desordenada falla, el driver de Scala informa los errores solo después de intentar todas las operaciones.
Nota
Las operaciones masivas desordenadas no garantizan un orden de ejecución. El orden puede variar según la forma en que se enumeran para optimizar el tiempo de ejecución.
Valor de retorno
El método bulkWrite() devuelve un objeto SingleObservable que contiene un BulkWriteResult. Puede acceder a la información de la instancia BulkWriteResult suscribiéndose al observable y utilizando los siguientes métodos:
Método | Descripción |
|---|---|
| Indicates if the server acknowledged the write operation. |
| The number of documents deleted, if any. |
| The number of documents inserted, if any. |
| The list of inserted documents, if any. |
| The number of documents matched for an update, if applicable. |
| The number of documents modified, if any. |
| The list of upserted documents, if any. |
Escritura masiva del cliente
Al conectarse a una implementación con MongoDB Server 8.0 o posterior, puede usar el método MongoClient.bulkWrite() para escribir en varias bases de datos y colecciones del mismo clúster. El método MongoClient.bulkWrite() realiza todas las operaciones de escritura en una sola llamada.
El método MongoClient.bulkWrite() toma un List que contiene una o más instancias de ClientNamespacedWriteModel para representar diferentes operaciones de escritura. Se pueden construir instancias de la interfaz ClientNamespacedWriteModel mediante métodos de instancia. Por ejemplo, una instancia de ClientNamespacedInsertOneModel representa una operación para insertar un documento; este modelo se puede crear mediante el método ClientNamespacedWriteModel.insertOne().
La siguiente tabla describe los modelos y sus métodos de instancia correspondientes:
Modelo | Método de instancia | Descripción | Parámetros |
|---|---|---|---|
|
| Crea un modelo para insertar un documento en |
|
|
| Crea un modelo para actualizar el primer documento en |
Debe pasar un valor para el parámetro |
|
| Crea un modelo para actualizar todos los documentos en |
Debe pasar un valor para el parámetro |
|
| Crea un modelo para reemplazar el primer documento en |
|
|
| Crea un modelo para eliminar el primer documento en |
|
|
| Crea un modelo para eliminar todos los documentos en |
|
Las siguientes secciones proporcionan algunos ejemplos de cómo crear modelos y utilizar el método de cliente bulkWrite().
Operaciones de inserción
Este ejemplo muestra cómo crear modelos que contienen instrucciones para insertar dos documentos. Un documento se inserta en la colección db.people y el otro documento se inserta en la colección db.things. La instancia MongoNamespace define la base de datos y la colección de destino a las que se aplica cada operación de guardar.
val personToInsert = ClientNamespacedWriteModel.insertOne( MongoNamespace("db", "people"), Document("name" -> "Julia Smith") ) val thingToInsert = ClientNamespacedWriteModel.insertOne( MongoNamespace("db", "things"), Document("object" -> "washing machine") );
Operaciones de actualizar
El siguiente ejemplo muestra cómo utilizar el método bulkWrite() para actualizar documentos existentes en las colecciones db.people y db.things:
val personUpdate = ClientNamespacedWriteModel.updateOne( MongoNamespace("db", "people"), equal("name", "Freya Polk"), inc("age", 1) ) val thingUpdate = ClientNamespacedWriteModel.updateMany( MongoNamespace("db", "things"), equal("category", "electronic"), set("manufacturer", "Premium Technologies") )
Este ejemplo incrementa el valor del campo age en 1 en el documento cuyo valor name es "Freya Polk" en la colección people. También establece el valor del campo manufacturer en "Premium Technologies" en todos los documentos cuyo valor category es "electronic" en la colección things.
Si varios documentos coinciden con el filtro de consulta especificado en una ClientNamespacedUpdateOneModel instancia, la operación actualiza el primer resultado. Puede especificar un orden de clasificación en una instancia ClientUpdateOneOptions para aplicarlo a los documentos coincidentes antes de que el controlador realice la operación de actualización, como se muestra en el siguiente código:
val options = ClientUpdateOneOptions .clientUpdateOneOptions() .sort(ascending("_id"))
Reemplazar operaciones
El siguiente ejemplo muestra cómo crear modelos para reemplazar documentos existentes en las colecciones db.people y db.things:
val personReplacement = ClientNamespacedWriteModel.replaceOne( MongoNamespace("db", "people"), equal("_id", 1), Document("name" -> "Frederic Hilbert") ) val thingReplacement = ClientNamespacedWriteModel.replaceOne( MongoNamespace("db", "things"), equal("_id", 1), Document("object" -> "potato") )
El ejemplo de código anterior reemplaza los siguientes documentos con documentos nuevos:
Documento en la colección
peopleque tiene un valor_idde1Documento en la colección
thingsque tiene un valor_idde1
Si varios documentos coinciden con el filtro de consulta especificado en una instancia ClientNamespacedReplaceOneModel, la operación reemplaza el primer resultado. Puede especificar un orden de clasificación en una instancia ClientReplaceOneOptions para aplicar un orden a los documentos coincidentes antes de que el controlador realice la operación de reemplazo, como se muestra en el siguiente código:
val options = ClientReplaceOneOptions .clientReplaceOneOptions() .sort(ascending("_id"))
Realizar la operación masiva
Después de definir una instancia ClientNamespacedWriteModel para cada operación que desee realizar, pase una lista de estas instancias al método bulkWrite() del cliente. De forma predeterminada, el método ejecuta las operaciones en el orden especificado.
El siguiente ejemplo realiza múltiples operaciones de escritura utilizando el método bulkWrite():
val peopleNamespace = MongoNamespace("db", "people") val thingsNamespace = MongoNamespace("db", "things") val writeModels = List( ClientNamespacedWriteModel.insertOne( peopleNamespace, Document("name" -> "Corey Kopper") ), ClientNamespacedWriteModel.replaceOne( thingsNamespace, equal("_id", 1), Document("object" -> "potato") ) ) val observable = mongoClient.bulkWrite(writeModels) observable.subscribe( (result: ClientBulkWriteResult) => println(result.toString), (error: Throwable) => println(s"Error: ${error.getMessage}"), () => println("Completed") )
AcknowledgedSummaryClientBulkWriteResult{insertedCount=1, matchedCount=1, ...}
Si alguna de las operaciones de escritura falla, el controlador genera un ClientBulkWriteException y no realiza ninguna otra operación individual. ClientBulkWriteException incluye un BulkWriteError al que se puede acceder mediante el método ClientBulkWriteException.getWriteErrors(), que proporciona información sobre la falla.
Personalizar escritura masiva
Puede pasar una instancia de ClientBulkWriteOptions al método bulkWrite() para personalizar cómo el controlador realiza la operación de escritura masiva.
Orden de ejecución
Por defecto, el controlador ejecuta las operaciones individuales en una operación en lote en el orden que usted especifique. El controlador ejecuta las operaciones hasta que ocurre un error o hasta que toda la operación por lotes se completa correctamente.
Sin embargo, puede pasar false al método ordered() al crear una instancia ClientBulkWriteOptions para indicar al controlador que realice operaciones de escritura desordenadas. Si pasa false, el controlador intenta ejecutar todas las operaciones de escritura en la operación de escritura masiva, incluso si una operación produce un error.
El siguiente código establece la opción ordered en false en una instancia de ClientBulkWriteOptions y realiza una operación de escritura masiva para insertar múltiples documentos:
val namespace = MongoNamespace("db", "people") val options = ClientBulkWriteOptions.clientBulkWriteOptions().ordered(false) val writeModels = List( ClientNamespacedWriteModel.insertOne(namespace, Document("_id" -> 1, "name" -> "Rudra Suraj")), // Causes a duplicate key error ClientNamespacedWriteModel.insertOne(namespace, Document("_id" -> 1, "name" -> "Mario Bianchi")), ClientNamespacedWriteModel.insertOne(namespace, Document("name" -> "Wendy Zhang")) ) val observable = mongoClient.bulkWrite(writeModels, options)
Debido a que la operación de escritura no está ordenada, el controlador realiza todas las operaciones que no generan errores, aunque la operación de escritura que inserta un documento con una clave duplicada genere un error.
Información Adicional
Para aprender a realizar operaciones de escritura individuales, consulte las siguientes guías:
Documentación de la API
Para aprender más sobre cualquiera de los métodos o tipos analizados en esta guía, consulta la siguiente documentación de API:
Colección Escritura masiva