Docs 菜单

Docs 主页开发应用程序MongoDB Manual

$binarySize(聚合)

在此页面上

  • 定义
  • 行为
  • 例子
$binarySize

返回给定字符串或二进制数据值内容的大小(以字节为单位)。

$binarySize 通过以下语法实现:

{ $binarySize: <string or binData> }

该参数可以是任何有效的表达式,只要它解析为字符串或二进制数据值即可。 有关表达式的更多信息,请参阅表达式操作符。

$binarySize的参数必须解析为:

  • 一个字符串,

  • 二进制数据值,或

  • null。

如果参数是字符串或二进制数据值,则表达式返回参数的大小(以字节为单位)。

如果参数为null ,则表达式返回null

如果参数解析为任何其他数据类型,则$binarySize出错。

如果$binarySize的参数是字符串,则该操作符会计算字符串中 UTF- 8编码的字节数,其中每个字符可能使用 1 到 4 个字节。

例如,US-ASCII 字符使用一个字节进行编码。 带有变音符号和附加拉丁字母字符的字符(即 英语字母表以外的拉丁字符)使用两个字节进行编码。 中文、日文和韩文字符通常需要三个字节,而其他平面的 unicode(表情符号、数学符号等)需要四个字节。

以以下示例为例:

例子
结果
注意
{ $binarySize: "abcde" }
5
每个字符使用一个字节进行编码。
{ $binarySize: "Hello World!" }
12
每个字符使用一个字节进行编码。
{ $binarySize: "cafeteria" }
9
每个字符使用一个字节进行编码。
{ $binarySize: "cafétéria" }
11
é 使用两个字节进行编码。
{ $binarySize: "" }
0
空字符串返回 0。
{ $binarySize: "$€λG" }
7
使用三个字节进行编码。 λ使用两个字节进行编码。
{ $binarySize: "寿司" }
6
每个字符使用三个字节进行编码。

mongosh中,使用以下文档创建名为images的示例集合:

db.images.insertMany([
{ _id: 1, name: "cat.jpg", binary: new BinData(0, "OEJTfmD8twzaj/LPKLIVkA==")},
{ _id: 2, name: "big_ben.jpg", binary: new BinData(0, "aGVsZmRqYWZqYmxhaGJsYXJnYWZkYXJlcTU1NDE1Z2FmZCBmZGFmZGE=")},
{ _id: 3, name: "tea_set.jpg", binary: new BinData(0, "MyIRAFVEd2aImaq7zN3u/w==")},
{ _id: 4, name: "concert.jpg", binary: new BinData(0, "TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlzIHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2YgdGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGludWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRoZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=")},
{ _id: 5, name: "empty.jpg", binary: new BinData(0, "") }
])

以下聚合projects

  • name 字段

  • imageSize字段,使用$binarySize返回文档binary字段的大小(以字节为单位)。

db.images.aggregate([
{
$project: {
"name": "$name",
"imageSize": { $binarySize: "$binary" }
}
}
])

操作返回以下结果:

{ "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 }
{ "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 }
{ "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 }
{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }
{ "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 }

以下管道返回具有最大二进制数据大小的图像:

db.images.aggregate([
// First Stage
{ $project: { name: "$name", imageSize: { $binarySize: "$binary" } } },
// Second Stage
{ $sort: { "imageSize" : -1 } },
// Third Stage
{ $limit: 1 }
])
第一个阶段:

管道projects的第一阶段:

  • name 字段

  • imageSize字段,使用$binarySize返回文档binary字段的大小(以字节为单位)。

此阶段将以下文档输出到下一阶段:

{ "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 }
{ "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 }
{ "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 }
{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }
{ "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 }
第二阶段

第二阶段按sorts imageSize文档。

此阶段将以下文档输出到下一阶段:

{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }
{ "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 }
{ "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 }
{ "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 }
{ "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 }
第三个阶段

第三阶段limits输出文档,仅返回按排序顺序排在第一位的文档:

{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }

提示

另请参阅:

← $avg(聚合)

在此页面上