Make the MongoDB docs better! We value your opinion. Share your feedback for a chance to win $100.
Click here >
Docs Menu
Docs Home
/ /

$similitudEuclidean (operador de expresión)

Nuevo en la versión 8.3.

$similarityEuclidean

Devuelve la distancia euclidiana entre dos vectores numéricos representados como matrices o valores binData. La distancia euclidiana mide la distancia en línea recta entre dos puntos en el espacio vectorial.

$similarityEuclidean tiene dos formas sintácticas.

La sintaxis concisa devuelve una distancia euclidiana bruta:

{ $similarityEuclidean: [ <vector1>, <vector2> ] }

La sintaxis completa acepta un parámetro de normalización opcional:

{
$similarityEuclidean: {
vectors: [ <vector1>, <vector2> ],
score: <boolean>
}
}

Al utilizar la sintaxis completa, acepta los siguientes$similarityEuclidean campos:

Campo
Tipo
Necesidad
Descripción

vectors

Arreglo

Requerido

Matriz de exactamente dos expresiones. Cada expresión debe resolverse en una matriz de valores numéricos o en un valor binData. Ambos vectores deben tener la misma longitud.

score

Booleano

Opcional

Cuando true, devuelve una puntuación normalizada en el rango (0, 1] usando la fórmula 1 / (1 + distance). Los vectores idénticos producen una puntuación de 1. El valor predeterminado es false.

Para obtener más información sobre expresiones, vea expresión.

Si alguno de los argumentos se resuelve en null o hace referencia a un campo faltante, $similarityEuclidean nulldevuelve.

$similarityEuclidean devuelve double un. Cuando score es false (el valor predeterminado), el resultado es la distancia euclidiana bruta, que siempre es mayor o igual 0 que. Una distancia de 0 significa que los vectores son idénticos. Valores mayores indican una mayor disimilitud.

Cuando score es true, el resultado se normaliza al rango (0, 1] usando la fórmula 1 / (1 + distance):

  • 1 indica que los vectores son idénticos (la distancia es 0).

  • Los valores cercanos a 0 indican una mayor disimilitud.

$similarityEuclidean Devuelve un error en los siguientes casos:

  • Ninguno de los argumentos se resuelve en una matriz o en un valor binData.

  • Los arrays de entrada o los valores binData tienen longitudes diferentes.

  • Ambos arrays contienen elementos no numéricos.

El siguiente ejemplo utiliza una colección vectors:

db.vectors.insertMany( [
{ _id: 1, a: [1, 2, 3], b: [1, 2, 3] },
{ _id: 2, a: [1, 2, 3], b: [3, 2, 1] },
{ _id: 3, a: [1, 2, 3], b: [4, 5, 6] }
] )

El siguiente proceso de agregación calcula la distancia euclidiana entre los campos a y b para cada documento y devuelve tanto la distancia bruta como la puntuación normalizada:

db.vectors.aggregate( [
{
$project: {
raw: { $similarityEuclidean: [ "$a", "$b" ] },
normalized: {
$similarityEuclidean: {
vectors: [ "$a", "$b" ],
score: true
}
}
}
}
] )

La operación devuelve los siguientes resultados:

{ _id: 1, raw: 0, normalized: 1 }
{ _id: 2, raw: 2.8284271247461903,
normalized: 0.2612038749637415 }
{ _id: 3, raw: 5.196152422706632,
normalized: 0.16139702886038895 }

Volver

$similarityDotProduct

En esta página