定義
$linearFillバージョン 5.3 で追加。
周囲のフィールド値に基づき、 線形補間 を使用して、 ウィンドウ内の
nullと欠落フィールドを埋めます。$linearFillは$setWindowFieldsステージでのみ使用可能です。
構文
$linearFill式は次の構文をとります。
{ $linearFill: <expression> }
式の詳細については、「式 」を参照してください。
動作
$linearFill は、周囲の null 以外のフィールド値に基づき、線形補間 を使用して null と欠落フィールドを埋めます。周囲のフィールド値は、$setWindowFields で指定された並べ替え順序によって決まります。
$linearFillは、周囲のnull以外の値の間の値範囲に按分された、nullと欠損値を埋めます。 欠落しているフィールドの値を決定するために、$linearFillは以下を使用します。周囲の
nullの値との差。周囲の値の間に入力する
nullフィールドの数。
$linearFillは、$setWindowFieldsで指定された並べ替え順序に従って、それらの値が先行してnullの値に続く場合、複数の連続するnull値を入力できます。例
これらのドキュメントがコレクションに含まれている場合:
{ index: 0, value: 0 }, { index: 1, value: null }, { index: 2, value: null }, { index: 3, value: null }, { index: 4, value: 10 } $linearFillを使用してnullの値を入力すると、ドキュメントは次のようになります。{ index: 0, value: 0 }, { index: 1, value: 2.5 }, { index: 2, value: 5 }, { index: 3, value: 7.5 }, { index: 4, value: 10 } 完全な例については、「例 」を参照してください。
nullnullの値が先行せず、その後に続く値はnullのままになります。
と$fill$linearFill の比較
線形補間 を使用して欠落しているフィールド値を埋め込むには、以下を使用します。
{ method: "linear" }を持つ$fillステージ。$fillステージを使用する場合、出力で指定するフィールドはソースデータと同じフィールドになります。 「欠落しているフィールド値を線形補間で入力する 」を参照してください。$linearFill$setWindowFieldsステージ内の 演算子。$linearFill演算子を使用すると、ソースデータとして使用されるフィールドとは異なるフィールドに値を設定できます。 「 1 つのステージで複数の入力メソッドを使用する 」を参照してください。
例
このページの例では、1 つの会社の株価を時間単位で追跡するstockコレクションを使用します。
db.stock.insertMany( [ { time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { time: ISODate("2021-03-08T10:00:00.000Z"), }, { time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { time: ISODate("2021-03-08T12:00:00.000Z") }, { time: ISODate("2021-03-08T13:00:00.000Z") }, { time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ] )
コレクション内の一部のドキュメントでpriceフィールドが欠落しています。
線形補間で欠損値を埋め込む
線形補間 を使用して欠落しているprice 値を入力するには、$linearFill $setWindowFieldsステージ内で を使用します。
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { price: { $linearFill: "$price" } } } } ] )
この例では、次のことが行われます。
sortBy: { time: 1 }は、ドキュメントをtimeフィールドで最初から最新の順に昇順でソートします。出力は以下を指定します。
price欠落値を入力するフィールドとして。{ $linearFill: "$price" }欠落しているフィールドの値として 。$linearFillは、シーケンス内の周囲のprice値に基づき、線形補間 を使用して欠落しているprice値を埋めます。
出力例:
[ { _id: ObjectId("620ad555394d47411658b5ef"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { _id: ObjectId("620ad555394d47411658b5f0"), time: ISODate("2021-03-08T10:00:00.000Z"), price: 507.5 }, { _id: ObjectId("620ad555394d47411658b5f1"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { _id: ObjectId("620ad555394d47411658b5f2"), time: ISODate("2021-03-08T12:00:00.000Z"), price: 505 }, { _id: ObjectId("620ad555394d47411658b5f3"), time: ISODate("2021-03-08T13:00:00.000Z"), price: 495 }, { _id: ObjectId("620ad555394d47411658b5f4"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ]
1 つのステージで複数の入力メソッドを使用する
$setWindowFieldsステージを使用して欠落値を入力する場合、入力フィールドとは異なるフィールドに値を設定できます。 その結果、単一の$setWindowFieldsステージで複数の入力メソッドを使用して、結果を個別のフィールドに出力できます。
次のパイプラインは、線形補間 と last-observation-carried-forward メソッドを使用して、欠落している price フィールドを入力します。
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { linearFillPrice: { $linearFill: "$price" }, locfPrice: { $locf: "$price" } } } } ] )
この例では、次のことが行われます。
sortBy: { time: 1 }は、ドキュメントをtimeフィールドで最初から最新の順に昇順でソートします。出力は以下を指定します。
linearFillPrice入力するターゲット フィールドとして を使用します。{ $linearFill: "$price" }は、linearFillPriceフィールドの値です。$linearFillは、シーケンス内の周囲のprice値に基づき、線形補間 を使用して欠落しているprice値を埋めます。
locfPrice入力するターゲット フィールドとして を使用します。{ $locf: "$price" }は、locfPriceフィールドの値です。locfは、転送された最後の観察を示します。$locfは、欠落しているprice値をシーケンス内の前のドキュメントの値で埋めます。
出力例:
[ { _id: ObjectId("620ad555394d47411658b5ef"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500, linearFillPrice: 500, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f0"), time: ISODate("2021-03-08T10:00:00.000Z"), linearFillPrice: 507.5, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f1"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515, linearFillPrice: 515, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f2"), time: ISODate("2021-03-08T12:00:00.000Z"), linearFillPrice: 505, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f3"), time: ISODate("2021-03-08T13:00:00.000Z"), linearFillPrice: 495, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f4"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485, linearFillPrice: 485, locfPrice: 485 } ]
制限事項
$linearFillを使用するには、 sortByフィールドを使用してデータをソートする必要があります。$linearFillウィンドウ関数を使用する場合、単一の$setWindowFieldsパーティション 内の sortBy フィールドに繰り返される値がある場合、 はエラーを返します。