リリースノート

次の新機能をご覧ください。

バージョン10.7
バージョン10.6
バージョン10.5
バージョン10.4
バージョン10.3
バージョン10.2
バージョン10.1.1
バージョン10.1.0
バージョン10.0

MongoDB Connector for Spark 10.7

10.7 connector リリースには、次の変更と新機能が含まれています。

警告

重大な変更

Spark 3.1.x を使用している場合は、Spark Connector バージョン 10.7 を使用するには、Apache Spark 3.2 以降にアップグレードする必要があります。Spark Connector は、Apache Spark バージョン 3.2 から 3.5 のみをサポートするようになりました。

各マイクロバッチで消費される変更ストリームイベントの数を制限する change.stream.micro.batch.max.rows 読み取り構成プロパティを追加します。レート制限には、change.stream.micro.batch.max.partition.count 構成プロパティを 1 に設定し、ソースデータベースのサイドカーコレクションへの書き込み (write) アクセスが必要です。
change.stream.micro.batch.max.rows プロパティが設定されている場合に、再開トークンを永続化するために使用されるサイドカーコレクションを指定する change.stream.micro.batch.max.rows.offset.collection 読み取り構成プロパティを追加します。デフォルトは __spark_resume_tokens です。

MongoDB Connector for Spark 10.6

10.6 connector リリースには、次の変更と新機能が含まれています。

変更ストリームの読み取り構成で fullDocumentBeforeChange オプションのサポートを追加します。これにより、変更ストリーム出力に変更イベントの前に完全なドキュメントを含めるかどうかを指定できます。このオプションの詳細については、ストリーミング読み取り構成オプションガイドの「変更ストリーム構成」セクションを参照してください。
上書きを実行するときにコレクションを切り捨てる方法を指定する truncateMode 書き込み構成オプションを追加します。このオプションの詳細については、ストリーミング書き込み構成ガイドの「概要」セクションを参照してください。
順序なし挿入操作を実行するときに重複キーエラーを無視するかどうかを決定する ignoreDuplicatesOnInsert 書き込み構成オプションを追加します。このオプションは、バッチするストリーミング書き込みの両方で使用できます。このオプションの詳細については、「バッチ書込み構成オプション」および「ストリーミング書込み構成オプション」のガイドを参照してください。

MongoDB Connector for Spark 10.5

10.5 connector リリースには、次の変更と新機能が含まれています。

SamplePartitioner、PaginateBySizePartitioner、AutoBucketPartitioner のバッチする読み取り構成でSpark コネクタとともにAtlas Data Federationを使用するためのサポートを追加します。

バッチする構成の詳細については、バッチ読み取り構成オプションページを参照してください。
デフォルトのバッチする読み取りパーティショニングの構成を次のように変更します。 AutoBucketPartitioner

MongoDB Connector for Spark 10.4

10.4 connector リリースには、次の変更と新機能が含まれています。

Java Sync Driver のバージョンを v 5.1 .x に更新します。

MongoDB Connector for Spark 10.3

10.3 のコネクターリリースには、次の新機能が含まれています。

Spark v 3.3のサポートを追加し、 v 3.4 、および v 3.5 。
マイクロバッチまたは継続的なストリーミングモードを使用する場合に、複数のコレクションを読み取るためのサポートを追加しました。
警告
重大な変更
複数のコレクションの読み取りをサポートすることで、次の重大な変更が導入されます。
- collection 構成オプションで使用されるコレクションの名前にカンマが含まれている場合、 Spark Connectorはそれを 2 つの異なるコレクションとして扱います。これを回避するには、カンマの前にバックスラッシュ（\）を付けてコンマをエスケープする必要があります。
- collection 構成オプションで使用されるコレクションの名前が「*」の場合、 Spark Connectorはそれをすべてのコレクションをスキャンするための仕様と解釈します。これを回避するには、アスタリスクの前にバックスラッシュ（\）を付けてアスタリスクをエスケープする必要があります。
- collection 構成オプションで使用されるコレクションの名前にバックスラッシュ（\）が含まれている場合、 Spark Connectorはバックスラッシュをエスケープ文字として扱い、値の解釈方法が変更される可能性があります。これを回避するには、バックスラッシュの前に別のバックスラッシュを付けて、バックスラッシュをエスケープする必要があります。
複数のコレクションをスキャンする方法の詳細については、コレクション構成プロパティの説明を参照してください。

MongoDB Connector for Spark 10.2

10.2 connector リリースには、次の新機能が含まれています。

コネクタが null 値を無視するかどうかを制御できるignoreNullValues書込み構成プロパティを追加しました。以前のバージョンでは、connector は常に MongoDB にnull値を書込みました。
convertJson書込み構成プロパティのオプションを追加しました。
マイクロバッチを複数のパーティションに分割して並列処理が可能になるchange.stream.micro.batch.max.partition.count読み取り構成プロパティを追加しました。
change.stream.publish.full.document.only読み取り構成プロパティを使用する場合の変更ストリームスキーマの推論が改善されました。
オフセットが使用できない場合にコネクタが変更イベントを処理する方法を指定するchange.stream.startup.mode読み取り構成プロパティを追加しました。
操作にコメントを追加するためのサポート。

MongoDB Connector for Spark 10.1.1

$collStatsパイプラインステージを含む集計が時系列コレクションのカウントフィールドを返さないバグを修正しました。

MongoDB Connector for Spark 10.1.0

Scala のサポート2.13 。
Spark Structured Streaming によるマイクロバッチモードのサポート
BSON データ型のサポート
空のコレクションのパーティションのサポートを改善しました。
書込み (write) 操作の自動アップサートを無効にするオプション。
空の配列のスキーマ推論を改善しました。
配列とリスト内の null 値をサポートします。 Connector は例外をスローする代わりに、これらの値を MongoDB に書込むようになりました。

詳細については、でMongoDB Blog こちらの記事を参照してください。

MongoDB Connector for Spark 10.0.0

Spark Structured Streaming のサポート

戻る

FAQ