定义
$linearFill5.3 版本中的新增功能。
根据周围字段值,使用 线性插值
null来填充 和缺失的窗口。$linearFill只能在$setWindowFields阶段使用。
语法
$linearFill 表达式的语法如下:
{ $linearFill: <expression> }
有关表达式的更多信息,请参阅表达式。
行为
$linearFill 使用基于周围非 null 字段值的线性插值来填充 null 和缺失字段。周围的字段值由$setWindowFields中指定的排序顺序确定。
$linearFill按比例填充null和缺失值,这些值跨越周围的非null值之间的值范围。 为了确定缺失字段的值,$linearFill使用:周围非
null值之差。周围值之间要填充的
null字段的数量。
$linearFill可以填充多个连续的null值,前提是根据$setWindowFields中指定的排序顺序,这些值的前后都是非null值例子
如果集合中包含这些文档:
{ index: 0, value: 0 }, { index: 1, value: null }, { index: 2, value: null }, { index: 3, value: null }, { index: 4, value: 10 } 使用
$linearFill填充null值后,文档变为:{ index: 0, value: 0 }, { index: 1, value: 2.5 }, { index: 2, value: 5 }, { index: 3, value: 7.5 }, { index: 4, value: 10 } 有关完整示例,请参阅示例。
null前后没有非null值的值仍为null。
和$fill$linearFill 的比较
要使用线性插值填充缺失字段值,可以使用:
具有
{ method: "linear" }的$fill阶段。使用
$fill阶段时,您在输出中指定的字段与源数据使用的字段相同。 请参阅使用线性插值填充缺失字段值。$linearFill$setWindowFields阶段内的 操作符。使用
$linearFill操作符时,您可以为与用作源数据的字段不同的字段设置值。 请参阅在单个阶段中使用多种填充方法。
示例
本页上的示例使用stock集合,其中包含每小时跟踪单个公司的股票价格:
db.stock.insertMany( [ { time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { time: ISODate("2021-03-08T10:00:00.000Z"), }, { time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { time: ISODate("2021-03-08T12:00:00.000Z") }, { time: ISODate("2021-03-08T13:00:00.000Z") }, { time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ] )
集合中的某些文档缺少 price 字段。
使用线性插值填充缺失值
要使用price 线性插值 填充缺失的 值,请在$linearFill $setWindowFields阶段内使用 :
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { price: { $linearFill: "$price" } } } } ] )
在示例中:
sortBy: { time: 1 }按time字段以升序排列文档,从最早到最晚。输出指定:
price作为要填写缺失值的字段。{ $linearFill: "$price" }作为缺失字段的值。$linearFill使用基于序列中周围price值的 线性插值 来填充缺失的price值。
示例输出:
[ { _id: ObjectId("620ad555394d47411658b5ef"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { _id: ObjectId("620ad555394d47411658b5f0"), time: ISODate("2021-03-08T10:00:00.000Z"), price: 507.5 }, { _id: ObjectId("620ad555394d47411658b5f1"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { _id: ObjectId("620ad555394d47411658b5f2"), time: ISODate("2021-03-08T12:00:00.000Z"), price: 505 }, { _id: ObjectId("620ad555394d47411658b5f3"), time: ISODate("2021-03-08T13:00:00.000Z"), price: 495 }, { _id: ObjectId("620ad555394d47411658b5f4"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ]
在单个阶段使用多种填充方法
当您使用$setWindowFields阶段填充缺失值时,您可以为与填充字段不同的字段设置值。 因此,您可以在单个$setWindowFields阶段使用多种填充方法,并在不同字段中输出结果。
以下管道使用price 线性插值 填充缺失的 字段 以及最后观察结转方法:
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { linearFillPrice: { $linearFill: "$price" }, locfPrice: { $locf: "$price" } } } } ] )
在示例中:
sortBy: { time: 1 }按time字段以升序排列文档,从最早到最晚。输出指定:
linearFillPrice作为要填充的目标字段。{ $linearFill: "$price" }是linearFillPrice字段的值。$linearFill使用基于序列中周围price值的线性插值来填充缺失的price值。
locfPrice作为要填充的目标字段。{ $locf: "$price" }是locfPrice字段的值。locf代表最后的观察结果。$locf使用序列中上一个文档中的值填充缺失的price值。
示例输出:
[ { _id: ObjectId("620ad555394d47411658b5ef"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500, linearFillPrice: 500, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f0"), time: ISODate("2021-03-08T10:00:00.000Z"), linearFillPrice: 507.5, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f1"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515, linearFillPrice: 515, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f2"), time: ISODate("2021-03-08T12:00:00.000Z"), linearFillPrice: 505, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f3"), time: ISODate("2021-03-08T13:00:00.000Z"), linearFillPrice: 495, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f4"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485, linearFillPrice: 485, locfPrice: 485 } ]
限制
要使用
$linearFill,您必须使用sortBy字段对数据进行排序。使用
$linearFill窗口函数时,如果单个$setWindowFields分区 中的 sortBy 字段有任何重复值, 会返回错误。