定义
$locf5.2 版本中的新增功能。
最后一次观察结果被延续了下来。 将窗口中
null和缺失字段的值设置为该字段的最后一个非空值。$locf只能在$setWindowFields阶段使用。
语法
$locf 表达式的语法如下:
{ $locf: <expression> }
有关表达式的更多信息,请参阅表达式。
行为
如果填充的字段同时包含null和非空值,则$locf会根据$setWindowFields中指定的排序顺序将null和缺失值设置为字段的最后一个已知非空值。
null 而排序顺序中出现在非空值之前的缺失字段值仍为 null。
如果填充的字段仅包含null或分区中的缺失值,则$locf会将该分区的字段值设置为null 。
和$fill$locf 的比较
要根据序列中的最后一个观察值填充缺失的字段值,可以使用:
具有
{ method: "locf" }的$fill阶段。使用
$fill阶段时,您在输出中指定的字段与源数据使用的字段相同。 请参阅根据上次观察到的值填充缺失字段值。$locf$setWindowFields阶段内的 操作符。使用
$locf操作符时,您可以为与用作源数据的字段不同的字段设置值。 请参阅在单个阶段中使用多种填充方法。
示例
本页上的示例使用stock集合,其中包含每小时跟踪单个公司的股票价格:
db.stock.insertMany( [ { time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { time: ISODate("2021-03-08T10:00:00.000Z"), }, { time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { time: ISODate("2021-03-08T12:00:00.000Z") }, { time: ISODate("2021-03-08T13:00:00.000Z") }, { time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ] )
集合中的某些文档缺少 price 字段。
用最后观察到的值填充缺失值
以下示例使用$locf操作符将缺失字段设置为上次观察到的非null值中的值:
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { price: { $locf: "$price" } } } } ] )
在示例中:
sortBy: { time: 1 }按time以升序 (1) 对每个分区中的文档进行排序,因此最早的time位于最前面。对于缺少
price字段的文档,$locf操作符会将price设置为序列中最后观察到的值。
示例输出:
[ { _id: ObjectId("62169b65394d47411658b5f5"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { _id: ObjectId("62169b65394d47411658b5f6"), time: ISODate("2021-03-08T10:00:00.000Z"), price: 500 }, { _id: ObjectId("62169b65394d47411658b5f7"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5f8"), time: ISODate("2021-03-08T12:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5f9"), time: ISODate("2021-03-08T13:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5fa"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ]
在单个阶段使用多种填充方法
当您使用$setWindowFields阶段填充缺失值时,您可以为与填充字段不同的字段设置值。 因此,您可以在单个$setWindowFields阶段使用多种填充方法,并在不同字段中输出结果。
以下管道使用线性插值 和 last-observation-carried-forward 方法填充缺失的 price 字段:
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { linearFillPrice: { $linearFill: "$price" }, locfPrice: { $locf: "$price" } } } } ] )
在示例中:
sortBy: { time: 1 }按time字段以升序排列文档,从最早到最晚。输出指定:
linearFillPrice作为要填充的目标字段。{ $linearFill: "$price" }是linearFillPrice字段的值。$linearFill使用基于序列中周围price值的 线性插值 来填充缺失的price值。
locfPrice作为要填充的目标字段。{ $locf: "$price" }是locfPrice字段的值。locf代表最后的观察结果。$locf使用序列中上一个文档中的值填充缺失的price值。
示例输出:
[ { _id: ObjectId("620ad555394d47411658b5ef"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500, linearFillPrice: 500, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f0"), time: ISODate("2021-03-08T10:00:00.000Z"), linearFillPrice: 507.5, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f1"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515, linearFillPrice: 515, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f2"), time: ISODate("2021-03-08T12:00:00.000Z"), linearFillPrice: 505, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f3"), time: ISODate("2021-03-08T13:00:00.000Z"), linearFillPrice: 495, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f4"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485, linearFillPrice: 485, locfPrice: 485 } ]