Definición
Nuevo en la versión 8.3.
$similarityEuclideanDevuelve la distancia euclidiana entre dos vectores numéricos representados como matrices o valores
binData. La distancia euclidiana mide la distancia en línea recta entre dos puntos en el espacio vectorial.$similarityEuclideantiene dos formas sintácticas.La sintaxis concisa devuelve una distancia euclidiana bruta:
{ $similarityEuclidean: [ <vector1>, <vector2> ] } La sintaxis completa acepta un parámetro de normalización opcional:
{ $similarityEuclidean: { vectors: [ <vector1>, <vector2> ], score: <boolean> } } Al utilizar la sintaxis completa, acepta los siguientes
$similarityEuclideancampos:CampoTipoNecesidadDescripciónvectorsArreglo
Requerido
Matriz de exactamente dos expresiones. Cada expresión debe resolverse en una matriz de valores numéricos o en un valor
binData. Ambos vectores deben tener la misma longitud.scoreBooleano
Opcional
Cuando
true, devuelve una puntuación normalizada en el rango(0, 1]usando la fórmula1 / (1 + distance). Los vectores idénticos producen una puntuación de1. El valor predeterminado esfalse.Para obtener más información sobre expresiones, vea expresión.
Comportamiento
null y valores faltantes
Si alguno de los argumentos se resuelve en null o hace referencia a un campo faltante, $similarityEuclidean nulldevuelve.
Valor de retorno
$similarityEuclidean devuelve double un. Cuando score es false (el valor predeterminado), el resultado es la distancia euclidiana bruta, que siempre es mayor o igual 0 que. Una distancia de 0 significa que los vectores son idénticos. Valores mayores indican una mayor disimilitud.
Cuando score es true, el resultado se normaliza al rango (0, 1] usando la fórmula 1 / (1 + distance):
1indica que los vectores son idénticos (la distancia es0).Los valores cercanos a
0indican una mayor disimilitud.
Errors
$similarityEuclidean Devuelve un error en los siguientes casos:
Ninguno de los argumentos se resuelve en una matriz o en un valor
binData.Los arrays de entrada o los valores
binDatatienen longitudes diferentes.Ambos arrays contienen elementos no numéricos.
Ejemplo
El siguiente ejemplo utiliza una colección vectors:
db.vectors.insertMany( [ { _id: 1, a: [1, 2, 3], b: [1, 2, 3] }, { _id: 2, a: [1, 2, 3], b: [3, 2, 1] }, { _id: 3, a: [1, 2, 3], b: [4, 5, 6] } ] )
El siguiente proceso de agregación calcula la distancia euclidiana entre los campos a y b para cada documento y devuelve tanto la distancia bruta como la puntuación normalizada:
db.vectors.aggregate( [ { $project: { raw: { $similarityEuclidean: [ "$a", "$b" ] }, normalized: { $similarityEuclidean: { vectors: [ "$a", "$b" ], score: true } } } } ] )
La operación devuelve los siguientes resultados:
{ _id: 1, raw: 0, normalized: 1 } { _id: 2, raw: 2.8284271247461903, normalized: 0.2612038749637415 } { _id: 3, raw: 5.196152422706632, normalized: 0.16139702886038895 }