/ /

Expressões

Página inicial do Docs

Desenvolvimento

Linguagem de query

Expressões

Página inicial do Docs

Desenvolvimento

Linguagem de query

Expressões

$ similarityEuclidean (operador de expressão )

Definição

Novidades na versão 8.3.

$similarityEuclidean

Retorna a distância euclideana entre dois vetores numéricos representados como arrays ou valores binData. A distância euclideana mede a distância em linha reta entre dois pontos no espaço vetorial.

$similarityEuclidean tem dois formatos de sintaxe .

A sintaxe concisa retorna uma distância euclideana bruta:

{ $similarityEuclidean: [ <vector1>, <vector2> ] }

A sintaxe completa aceita um parâmetro de normalização opcional:

{
   $similarityEuclidean: {
      vectors: [ <vector1>, <vector2> ],
      score: <boolean>
   }
}

Ao utilizar a sintaxe completa, o $similarityEuclidean aceita os seguintes campos:

Campo	Tipo	necessidade	Descrição
`vectors`	Array	Obrigatório	Array de exatamente duas expressões. Cada expressão deve ser resolvida para uma array de valores numéricos ou um valor `binData`. Ambos os vetores devem ter comprimento igual.
`score`	Boolean	Opcional	Quando `true`, retorna uma pontuação normalizada na faixa `(0, 1]` usando a fórmula `1 / (1 + distance)`. Vetores idênticos produzem uma pontuação de `1`. O padrão é `false`.

Para mais informações sobre expressões, consulte Expressões do .

Comportamento

`null` e valores ausentes

Se qualquer um dos argumentos resultar em null ou se referir a um campo ausente, $similarityEuclidean retornará null.

Valor de retorno

$similarityEuclidean retorna um double. Quando score é false (o padrão), o resultado é a distância euclideana bruta, que é sempre maior ou igual a 0. Uma distância de 0 significa que os vetores são idênticos. Valores maiores indicam maior disparidade.

Quando score é true, o resultado é normalizado para a faixa (0, 1] utilizando a fórmula 1 / (1 + distance):

1 indica que os vetores são idênticos (a distância é 0).
Valores próximos a 0 indicam maior disparidade.

Errors

$similarityEuclidean retorna um erro nos seguintes casos:

Qualquer argumento não resulta em uma array ou no valor binData.
Arrays de entrada ou valores binData têm comprimentos diferentes.
Qualquer array contém elementos não numéricos.

Exemplo

O exemplo a seguir utiliza uma coleção vectors:

db.vectors.insertMany( [
   { _id: 1, a: [1, 2, 3], b: [1, 2, 3] },
   { _id: 2, a: [1, 2, 3], b: [3, 2, 1] },
   { _id: 3, a: [1, 2, 3], b: [4, 5, 6] }
] )

O seguinte pipeline de agregação calcula a distância euclideana entre os campos a e b para cada documento e retorna a distância bruta e a pontuação normalizada:

db.vectors.aggregate( [
   {
      $project: {
         raw: { $similarityEuclidean: [ "$a", "$b" ] },
         normalized: {
            $similarityEuclidean: {
               vectors: [ "$a", "$b" ],
               score: true
            }
         }
      }
   }
] )

A operação retorna os seguintes resultados:

{ _id: 1, raw: 0, normalized: 1 }
{ _id: 2, raw: 2.8284271247461903,
  normalized: 0.2612038749637415 }
{ _id: 3, raw: 5.196152422706632,
  normalized: 0.16139702886038895 }

Saiba mais

Voltar

$ similarityDotProduct

$size

Definição

Comportamento

null e valores ausentes

Valor de retorno

Errors

Exemplo

Saiba mais

`null` e valores ausentes