Menu Docs

Página inicial do DocsVisualizar & analisar dadosConector do Spark

Opções de configuração de gravação de streaming

Nesta página

  • Visão geral
  • Especificando propriedades em connection.uri

Você pode configurar as seguintes propriedades ao gravar dados no MongoDB no modo de streaming.

Observação

Se você usa o SparkConf para definir as configurações de gravação do conector, insira spark.mongodb.write. como prefixo em cada propriedade.

Nome da propriedade
Descrição
connection.uri
Obrigatório.
A chave de configuração da cadeia de conexão.

Padrão: mongodb://localhost:27017/
database
Obrigatório.
A configuração do nome do banco de dados.
collection
Obrigatório.
A configuração do nome da coleção.
comment
O comentário a ser anexado à operação de escrita. Os comentários aparecem na saída do Analisador de banco de dados.

Padrão: nenhum
mongoClientFactory
Chave de configuração do MongoClientFactory.
Você pode especificar uma implementação personalizada que deverá implementar a interface do com.mongodb.spark.sql.connector.connection.MongoClientFactory.

Padrão: com.mongodb.spark.sql.connector.connection.DefaultMongoClientFactory
checkpointLocation
O caminho do arquivo absoluto do diretório no qual o conector grava informações do ponto de verificação.


Padrão: nenhum
forceDeleteTempCheckpointLocation
Um valor booleano que especifica se os dados de checkpoint existentes devem ser excluídos.

Padrão: false

Se você usa SparkConf para especificar qualquer uma das configurações anteriores, você poderá incluí-las na configuração do connection.uri ou listá-las individualmente.

O exemplo de código a seguir mostra como especificar o banco de dados, a coleção e a configuração convertJson como parte da configuração connection.uri:

spark.mongodb.write.connection.uri=mongodb://127.0.0.1/myDB.myCollection?convertJson=any

Para manter o connection.uri curto e facilitar a leitura das configurações, você pode especificá-las individualmente:

spark.mongodb.write.connection.uri=mongodb://127.0.0.1/
spark.mongodb.write.database=myDB
spark.mongodb.write.collection=myCollection
spark.mongodb.write.convertJson=any

Importante

Se você especificar uma configuração em connection.uri e em sua própria linha, a configuração connection.uri terá precedência. Por exemplo, na configuração abaixo, o banco de dados de conexão é foobar:

spark.mongodb.write.connection.uri=mongodb://127.0.0.1/foobar
spark.mongodb.write.database=bar
← Gravar no MongoDB no modo de transmissão