Overview
El Spark Connector admite el modo de transmisión, que utiliza Spark Structured Streaming para procesar datos en cuanto están disponibles en lugar de esperar a que transcurra un intervalo de tiempo. Spark Structured Streaming es un motor de transmisión de datos que puedes acceder mediante la API Dataset o DataFrame.
Importante
Apache Spark contiene dos motores de procesamiento de flujo diferentes:
Spark Streaming con DStreams, ahora un motor heredado sin soporte
Esta guía se aplica únicamente a Spark Structured Streaming.
Las siguientes secciones le muestran cómo usar Spark Connector para leer datos de MongoDB y guardar datos en MongoDB en modo de transmisión:
Tip
Documentación de Apache Spark
Para aprender más sobre cómo utilizar Spark para procesar flujos de datos, consulta la Guía de programación de Spark.