Overview
El Spark Connector admite el modo de transmisión, que utiliza Spark Structured Streaming para procesar datos en cuanto están disponibles en lugar de esperar a que transcurra un intervalo de tiempo. Spark Structured Streaming es un motor de transmisión de datos que puedes acceder mediante la API Dataset o DataFrame.
Importante
Apache Spark contiene dos motores de procesamiento de flujo diferentes:
Spark transmisión con DStreamsa continuación, un motor obsoleto que ya no es compatible
Esta guía se refiere únicamente a Spark Structured transmisión.
Las siguientes secciones le muestran cómo usar Spark Connector para leer datos de MongoDB y guardar datos en MongoDB en modo de transmisión:
Tip
Documentación de Apache Spark
Para aprender más sobre cómo utilizar Spark para procesar flujos de datos, consulta la Guía de programación de Spark.