Overview
以流式传输模式向 MongoDB 写入数据时,可以配置以下属性。
注意
如果您使用 SparkConf 设置连接器的写入配置,请为每个属性添加前缀 spark.mongodb.write.。
属性名称 | 说明 | |
|---|---|---|
| 必需。 | |
| 必需。 | |
| 必需。 | |
| ||
| MongoClientFactory 配置键。您可以指定必须实现 接口的自定义实施。默认值: | |
| 指定Connector是否解析字符串值并将扩展JSON转换为BSON。此设置接受以下值:
默认: | |
| 指定用于分割集合数据的字段或字段列表。要指定多个字段,请使用逗号分隔字段,如以下示例所示: 默认: | |
| 如果为 | |
| 指定批量操作中要批处理的最大操作数。默认值: | |
| 指定要执行的写入操作类型。可以将其设置为下列其中一个值:
| |
| 指定是否执行有序批量操作。默认值: | |
| 为 | |
| 指定 | |
|
| |
| 指定 | |
| ||
| 布尔值,指定是否删除现有检查点数据。默认值: | |
| 指定在执行覆盖时如何截断集合。您可以将此选项设立为以下值之一:
| |
| 设立为 |
指定属性,在 connection.uri
如果使用 SparkConf 指定了之前的任何设置,可以将其包含在 connection.uri 设置中,也可以单独列出。
以下代码示例显示如何将数据库、集合和 convertJson 设置指定为 connection.uri 设置的一部分:
spark.mongodb.write.connection.uri=mongodb://127.0.0.1/myDB.myCollection?convertJson=any
为了缩短 connection.uri 并使设置更易于阅读,您可以改为单独指定它们:
spark.mongodb.write.connection.uri=mongodb://127.0.0.1/ spark.mongodb.write.database=myDB spark.mongodb.write.collection=myCollection spark.mongodb.write.convertJson=any
重要
如果您在 connection.uri 及其自己的行中都指定了某个设置,则 connection.uri 设置优先。例如,在以下配置中,连接数据库为 foobar:
spark.mongodb.write.connection.uri=mongodb://127.0.0.1/foobar spark.mongodb.write.database=bar