/ /

$text operador del query

Docs Home

/ /

Búsqueda de texto

$text operador del query

$text operador del query

$text

Nota

MongoDB ofrece una solución de búsqueda de texto completo mejorada, MongoDB Search, y la solución de búsqueda semántica, MongoDB Vector Search. Recomendamos utilizar el $search, $searchMeta, o $vectorSearch etapas, en lugar del operador $text.

Esta página describe el operador $text para las implementaciones autogestionadas.

Definición

$text: $text realiza una query de texto en campos indexados con un índice de texto.

Compatibilidad

Puedes usar $text para implementaciones alojadas en los siguientes entornos:

MongoDB Atlas: El servicio totalmente gestionado para implementaciones de MongoDB en la nube

MongoDB Enterprise: La versión basada en suscripción y autogestionada de MongoDB
MongoDB Community: La versión de MongoDB con código fuente disponible, de uso gratuito y autogestionada.

Sintaxis

Una expresión $text tiene la siguiente sintaxis:

{
  $text: {
    $search: <string>,
    $language: <string>,
    $caseSensitive: <boolean>,
    $diacriticSensitive: <boolean>
  }
}

El operador $text acepta estos campos:

Campo	Tipo	Descripción
`$search`	string	Una string de términos que MongoDB analiza y usa para consultar el índice de texto. MongoDB realiza una logical `OR` query sobre los terms a menos que se especifique una exact string. Consulta Comportamiento para más detalles.
`$language`	string	opcional. El lenguaje que determina las palabras vacías, el stemmer y las reglas del tokenizador. Por defecto, es el lenguaje del índice. Para consultar los lenguajes compatibles, véase $text Lenguajes de consulta en implementaciones autogestionadas. Si especificas un valor `default_language` de `none`, el índice de texto analiza cada palabra en el campo, incluidas las palabras irrelevantes, e ignora la lematización de sufijos.
`$caseSensitive`	booleano	Opcional. Activa la sensibilidad a mayúsculas y minúsculas. Los valores por defecto son `false`. Consulta Insensibilidad a mayúsculas y minúsculas.
`$diacriticSensitive`	booleano	Opcional. Habilita la sensibilidad diacrítica para los 3 índices de texto de la versión. El valor predeterminado `false` es. Las versiones anteriores de los índices de texto siempre son sensibles a los diacríticos.Consulte Insensibilidad diacrítica.

De forma predeterminada, $text no ordena los resultados por puntuación. Consulta Puntuación de texto para obtener más información sobre la ordenación por puntuación.

Comportamiento

Restricciones

Una query puede especificar solo una expresión $text.
$text no puede aparecer en expresiones $nor.
$text no puede aparecer en $elemMatch query o expresiones de proyección.
Todas las cláusulas deben estar indexadas $or para $text utilizar.
Si un query incluye una expresión $text, no se puede usar hint() para especificar qué índice usar para el query.
Las consultas con $text no pueden usar $natural orden.
No se puede combinar la expresión $text, que requiere un índice de texto especial, con un operador del query que requiera un tipo diferente de índice especial. Por ejemplo, no se puede combinar la expresión $text con el operador $near.
Las vistas no son compatibles con $text.
Stable API V1 no admite $text para la creación de índices.

Si se utiliza el operador $text en la agregación, también se aplican las siguientes restricciones.

La etapa $match que incluye un $text debe ser la primera etapa en el pipeline.
Un operador $text solo puede ocurrir una vez en la etapa.
La expresión del Operador $text no puede aparecer en $or ni en $not.
$text, por defecto, no devuelve los documentos coincidentes en el orden de las puntuaciones de coincidencia. Para ordenar por puntuación descendente, utiliza la expresión de agregación $meta en la etapa $sort.

`$search` Campo

En el campo $search, especifica las palabras que MongoDB utiliza para query el índice de texto.

Nota

El campo $search difiere del $search agregación stage de MongoDB Atlas. La etapa $search proporciona búsqueda de texto completo y está disponible solo en MongoDB Atlas.

Cadenas exactas

Para que coincida exactamente con una cadena de varias palabras en lugar de términos individuales, encierre la cadena entre comillas dobles de escape (\"): como en:

"\"ssl certificate\""

Si la string $search de una operación $text incluye una string de varias palabras y términos individuales, $text solo coincide con los documentos que incluyan la string de varias palabras.

Por ejemplo, esta $search string devuelve documentos con la string exacta "ssl certificate":

"\"ssl certificate\" authority key"

Negaciones

Anteponga un guión (–) a una palabra- para negarla:

Las palabras negadas excluyen los documentos que contienen la palabra negada del conjunto de resultados.
Una cadena con solo palabras negadas no coincide con ningún documento.
Las palabras con guion, como pre-market, no son negaciones. MongoDB trata el guion como delimitador. Para negar market, use pre -market.

MongoDB aplica todas las negaciones a la operación con AND lógico.

Operación de coincidencia

Palabras irrelevantes

MongoDB ignora las palabras vacías específicas del lenguaje, como the y and en inglés.

Palabras lematizadas

Con insensibilidad a mayúsculas, minúsculas y diacríticos, $text coincide con toda la palabra reducida. Si un campo de documento contiene blueberry, un término $search de blue no coincide. Sin embargo, blueberry o blueberries sí coinciden.

Sensibilidad a mayúsculas y minúsculas y palabras lematizadas

Con la sensibilidad a mayúsculas y minúsculas activada ($caseSensitive: true), si el prefijo de sufijo contiene letras mayúsculas, $text coincide con la palabra exacta.

Distinción de diacríticas y palabras lematizadas

Con la sensibilidad a diacríticos habilitada ($diacriticSensitive: true), si la raíz del sufijo contiene signos diacríticos, $text coincide exactamente con la palabra.

Insensibilidad a las mayúsculas y minúsculas

$text establece por defecto la insensibilidad a mayúsculas y minúsculas del índice de texto:

El índice de texto de la versión 3 no distingue entre mayúsculas y minúsculas para caracteres latinos con o sin diacríticos y alfabetos no latinos como el cirílico.
En versiones anteriores, no se diferencia entre mayúsculas y minúsculas de caracteres latinos sin signos diacríticos ([A-z]).

Activación de la sensibilidad a mayúsculas y minúsculas

Especifique $caseSensitive: true para habilitar la distinción entre mayúsculas y minúsculas cuando el índice de texto no distinga entre mayúsculas y minúsculas.

Proceso de sensibilidad a los casos

Cuando $caseSensitive: true y el índice de texto no distingue entre mayúsculas y minúsculas, $text:

Consulta el índice de texto en busca de coincidencias que no distingan entre mayúsculas y minúsculas y diacríticos.
Filtra los resultados para devolver sólo los documentos que coincidan con el caso especificado.

Cuando $caseSensitive: true y el sufijo contiene letras mayúsculas, $text coincide con la palabra exacta.

Habilitar $caseSensitive: true puede disminuir el rendimiento.

Insensibilidad a los diacríticos

$text por defecto para la insensibilidad diacrítica del índice texto:

La versión 3 índice de texto no distingue entre mayúsculas y minúsculas. El índice no distingue entre caracteres con marcas diacríticas y sus contrapartes sin marcas (é, ê, e).
Las versiones anteriores son sensibles a los signos diacríticos.

Activar la sensibilidad a los diacríticos

Especifique $diacriticSensitive: true para habilitar la sensibilidad a diacríticos con índices de texto de la versión 3.

Las versiones anteriores del índice de texto siempre son sensibles a los signos diacríticos, por lo que $diacriticSensitive no tiene efecto.

Proceso de sensibilidad a los diacríticos

Con los índices de texto de la versión 3 y $diacriticSensitive: true, $text:

Consulta el índice de texto insensible a los signos diacríticos.
Filtra los resultados para devolver sólo los documentos que coincidan con los signos diacríticos en los términos especificados.

Habilitar $diacriticSensitive: true puede disminuir el rendimiento.

Con versiones de índice de texto anteriores, $diacriticSensitive: true consulta el índice de texto que ya es sensible a los diacríticos.

Cuando $diacriticSensitive: true y la raíz del sufijo contiene marcas diacríticas, $text coincide con la palabra exacta.

Tip

Palabras lematizadas

Puntuación del texto

El operador $text asigna una puntuación a cada documento de resultado. La puntuación representa la relevancia de un documento para un query determinado. La puntuación puede ser parte de una especificación de un método sort(), así como parte de la expresión de proyección. La expresión { $meta: "textScore" } proporciona información sobre el procesamiento de la operación $text. Consulta el operador de proyección $meta para obtener detalles sobre cómo acceder a la puntuación para proyección o clasificación.

Ejemplos

Los siguientes ejemplos utilizan una colección articles con un índice texto versión 3 en subject:

db.articles.createIndex( { subject: "text" } )

Rellena la colección con los siguientes documentos:

db.articles.insertMany( [
     { _id: 1, subject: "coffee", author: "xyz", views: 50 },
     { _id: 2, subject: "Coffee Shopping", author: "efg", views: 5 },
     { _id: 3, subject: "Baking a cake", author: "abc", views: 90  },
     { _id: 4, subject: "baking", author: "xyz", views: 100 },
     { _id: 5, subject: "Café Con Leche", author: "abc", views: 200 },
     { _id: 6, subject: "Сырники", author: "jkl", views: 80 },
     { _id: 7, subject: "coffee and cream", author: "efg", views: 10 },
     { _id: 8, subject: "Cafe con Leche", author: "xyz", views: 10 }
] )

Buscar una sola palabra

Este ejemplo especifica coffee en la string $search:

db.articles.find( { $text: { $search: "coffee" } } )

Esto devuelve documentos que contienen la versión lematizada de coffee en el campo de índice subject:

{ _id: 1, subject: 'coffee', author: 'xyz', views: 50 },
{ _id: 7, subject: 'coffee and cream', author: 'efg', views: 10 },
{ _id: 2, subject: 'Coffee Shopping', author: 'efg', views: 5 }

Tip

Insensibilidad a las mayúsculas y minúsculas
Palabras lematizadas

Coincidir con cualquier término de búsqueda

Un string $search delimitado por espacios realiza un OR lógico en cada término. MongoDB devuelve documentos que contienen cualquiera de los términos.

Este ejemplo especifica tres términos delimitados por espacios:

db.articles.find( { $text: { $search: "bake coffee cake" } } )

Esto devuelve documentos que contienen las versiones derivadas bake de, coffee o cake en el subject campo indexado:

{ "_id" : 2, "subject" : "Coffee Shopping", "author" : "efg", "views" : 5 }
{ "_id" : 7, "subject" : "coffee and cream", "author" : "efg", "views" : 10 }
{ "_id" : 1, "subject" : "coffee", "author" : "xyz", "views" : 50 }
{ "_id" : 3, "subject" : "Baking a cake", "author" : "abc", "views" : 90 }
{ "_id" : 4, "subject" : "baking", "author" : "xyz", "views" : 100 }

Tip

Insensibilidad a las mayúsculas y minúsculas
Palabras lematizadas

Buscar un String exacto

Escapa las comillas para coincidir con una string exacta de varias palabras.

Este ejemplo coincide exactamente con la cadena coffee shop:

db.articles.find( { $text: { $search: "\"coffee shop\"" } } )

Esta operación devuelve documentos que contienen la string coffee shop:

{ "_id" : 2, "subject" : "Coffee Shopping", "author" : "efg", "views" : 5 }

Este ejemplo realiza un OR lógico de dos cadenas exactas:

db.articles.find( { $text: { $search: "\'coffee shop\' \'Cafe con Leche\'" } } )

Esto devuelve documentos que contienen cualquiera de las cadenas, incluidos documentos con términos de ambas cadenas:

[
  { _id: 8, subject: 'Cafe con Leche', author: 'xyz', views: 10 },
  { _id: 5, subject: 'Café Con Leche', author: 'abc', views: 200 },
  { _id: 1, subject: 'coffee', author: 'xyz', views: 50 },
  { _id: 7, subject: 'coffee and cream', author: 'efg', views: 10 },
  { _id: 2, subject: 'Coffee Shopping', author: 'efg', views: 5 }
]

Tip

Cadenas exactas

Excluir documentos que contengan un término

Anteponer un término con - para excluir los documentos que contienen ese término.

Este ejemplo coincide con documentos que contienen coffee, pero no shop (versiones con desinencias):

db.articles.find( { $text: { $search: "coffee -shop" } } )

La operación devuelve los siguientes documentos:

{ "_id" : 7, "subject" : "coffee and cream", "author" : "efg", "views" : 10 }
{ "_id" : 1, "subject" : "coffee", "author" : "xyz", "views" : 50 }

Query en otro idioma

Utilice $language para especificar el idioma que determina las palabras vacías, el lematizador y las reglas de tokenizador para la cadena $search.

Si especificas un valor default_language de none, el índice de texto analiza cada palabra en el campo, incluidas las palabras irrelevantes, e ignora la lematización de sufijos.

Este ejemplo especifica es (Español) como lenguaje:

db.articles.find(
   { $text: { $search: "leche", $language: "es" } }
)

El ejemplo devuelve los siguientes documentos:

{ "_id" : 5, "subject" : "Café Con Leche", "author" : "abc", "views" : 200 }
{ "_id" : 8, "subject" : "Cafe con Leche", "author" : "xyz", "views" : 10 }

También puede especificar idiomas por nombre,spanish como. Consulte "Idiomas de consulta de $text en implementaciones autogestionadas" para ver los idiomas compatibles.

Tip

Insensibilidad a las mayúsculas y minúsculas

Insensibilidad a mayúsculas y diacríticos

$text establece por defecto la insensibilidad a mayúsculas, minúsculas y signos diacríticos del índice de texto. Los índices de texto de la versión 3 no distinguen entre diacríticos y mayúsculas/minúsculas en caracteres latinos con diacríticos y alfabetos no latinos como el cirílico. Consulte Insensibilidad a mayúsculas y minúsculas del índice de texto y Insensibilidad a diacríticos del índice de texto.

Este ejemplo realiza una consulta que no distingue entre mayúsculas y minúsculas ni diacríticos:

db.articles.find( { $text: { $search: "сы́рники CAFÉS" } } )

Usando los índices de texto de la versión 3, esto coincide:

{ "_id" : 6, "subject" : "Сырники", "author" : "jkl", "views" : 80 }
{ "_id" : 5, "subject" : "Café Con Leche", "author" : "abc", "views" : 200 }
{ "_id" : 8, "subject" : "Cafe con Leche", "author" : "xyz", "views" : 10 }

Las versiones anteriores de índice de texto no coincidían con ningún documento.

Tip

Insensibilidad a las mayúsculas y minúsculas
Insensibilidad a los diacríticos
Palabras lematizadas
Índices de texto en implementaciones autogestionadas

Distinción entre mayúsculas y minúsculas

Habilita la sensibilidad a mayúsculas y minúsculas con $caseSensitive: true. Esto puede reducir el rendimiento.

Búsqueda de términos que distingue mayúsculas y minúsculas

Este ejemplo realiza una query que distingue mayúsculas y minúsculas para Coffee:

db.articles.find( { $text: { $search: "Coffee", $caseSensitive: true } } )

Esto coincide solo con:

{ "_id" : 2, "subject" : "Coffee Shopping", "author" : "efg", "views" : 5 }

Tip

Insensibilidad a las mayúsculas y minúsculas
Sensibilidad a mayúsculas y minúsculas y palabras lematizadas

Búsqueda de String exacta respetando mayúsculas y minúsculas.

Este ejemplo realiza una consulta que distingue entre mayúsculas y minúsculas para una cadena de varias palabras exacta:

db.articles.find( {
   $text: { $search: "\"Café Con Leche\"", $caseSensitive: true }
} )

Esto coincide solo con:

{ "_id" : 5, "subject" : "Café Con Leche", "author" : "abc", "views" : 200 }

Tip

Sensibilidad a mayúsculas y minúsculas y palabras lematizadas
Insensibilidad a las mayúsculas y minúsculas

Búsqueda de términos negados sensible a mayúsculas y minúsculas

Puede utilizar la distinción entre mayúsculas y minúsculas con términos negados (términos con el prefijo -).

Este ejemplo realiza una consulta que distingue entre mayúsculas y minúsculas para documentos que contienen Coffee pero no shop (versiones derivadas):

db.articles.find( { $text: { $search: "Coffee -shop", $caseSensitive: true } } )

Esto coincide con:

{ "_id" : 2, "subject" : "Coffee Shopping", "author" : "efg" }

Tip

Sensibilidad a mayúsculas y minúsculas y palabras lematizadas
Negaciones

Distinción de diacríticas

Activa la sensibilidad a los diacríticos con la versión 3 text índices usando $diacriticSensitive: true. Esto puede reducir el rendimiento.

Búsqueda de términos sensibles a diacríticos

Este ejemplo realiza una query sensible a diacríticos para CAFÉ (versión reducida):

db.articles.find( { $text: { $search: "CAFÉ", $diacriticSensitive: true } } )

Esto coincide solo con:

{ "_id" : 5, "subject" : "Café Con Leche", "author" : "abc" }

Tip

Distinción de diacríticas y palabras lematizadas
Insensibilidad a los diacríticos
Insensibilidad a las mayúsculas y minúsculas

Búsqueda de términos negados sensibles a diacríticos

Puedes utilizar la sensibilidad a los diacríticos con términos negados (términos precedidos por -).

Este ejemplo realiza una query que distingue diacríticos para documentos que contienen leches pero no cafés (versiones con derivación):

db.articles.find(
  { $text: { $search: "leches -cafés", $diacriticSensitive: true } }
)

Esto coincide con:

{ "_id" : 8, "subject" : "Cafe con Leche", "author" : "xyz" }

Tip

Distinción de diacríticas y palabras lematizadas
Insensibilidad a los diacríticos
Insensibilidad a las mayúsculas y minúsculas

Ejemplos de puntuación de relevancia

Devuelva la puntuación de relevancia

Este ejemplo query por cake y utiliza $meta para añadir la puntuación de relevancia a cada documento coincidente:

db.articles.find(
   { $text: { $search: "cake" } },
   { score: { $meta: "textScore" } }
)

El documento devuelto incluye un campo score con la puntuación de relevancia:

{ "_id" : 3, "subject" : "Baking a cake", "author" : "abc", "views" : 90, "score" : 0.75 }

Tip

$meta

Ordenar por puntuación de relevancia

Puedes especificar la expresión { $meta: "textScore" } en sort() sin especificar también la expresión en la proyección. Por ejemplo:
```
db.articles.find(
   { $text: { $search: "cake" } }
).sort( { score: { $meta: "textScore" } } )
```
Como resultado, se pueden ordenar los documentos resultantes por su relevancia sin proyectar el textScore.
Si incluyes la expresión { $meta: "textScore" } tanto en la proyección como en el sort(), los documentos de proyección y orden pueden tener nombres de campo diferentes para la expresión.
For example, in the following operation, the projection uses a field named score for the expression and the sort() uses the field named ignoredName.
```
db.articles.find(
   { $text: { $search: "cake" } } ,
   { score: { $meta: "textScore" } }
).sort( { ignoredName: { $meta: "textScore" } } )
```

Tip

$meta

Devolver los 2 documentos coincidentes principales

Utiliza limit() con sort() para devolver los documentos coincidentes más relevantes.

Este ejemplo query para coffee, ordena por puntuación descendente y limita los resultados a los dos documentos principales:

db.articles.find(
   { $text: { $search: "coffee" } },
   { score: { $meta: "textScore" } }
).sort( { score: { $meta: "textScore" } } ).limit(2)

Tip

$meta

Combina $text con otras operaciones de query y ordenamiento

Este ejemplo busca documentos donde author es "xyz" y subject contiene coffee o bake. Se ordena por puntuación de relevancia ascendente date y descendente:

db.articles.find(
   { author: "xyz", $text: { $search: "coffee bake" } },
   { score: { $meta: "textScore" } }
).sort( { date: 1, score: { $meta: "textScore" } } )

Tip

$text en el pipeline de agregación

Volver

$text operador del query

Consultas $text en el pipeline de agregación

Nota

Definición

Compatibilidad

Sintaxis

Comportamiento

Restricciones

$search Campo

Nota

Cadenas exactas

Negaciones

Operación de coincidencia

Palabras irrelevantes

Palabras lematizadas

Sensibilidad a mayúsculas y minúsculas y palabras lematizadas

Distinción de diacríticas y palabras lematizadas

Insensibilidad a las mayúsculas y minúsculas

Activación de la sensibilidad a mayúsculas y minúsculas

Proceso de sensibilidad a los casos

Insensibilidad a los diacríticos

Activar la sensibilidad a los diacríticos

Proceso de sensibilidad a los diacríticos

Tip

Puntuación del texto

Ejemplos

Buscar una sola palabra

Tip

Coincidir con cualquier término de búsqueda

Tip

Buscar un String exacto

Tip

Excluir documentos que contengan un término

Tip

Query en otro idioma

Tip

Insensibilidad a mayúsculas y diacríticos

Tip

Distinción entre mayúsculas y minúsculas

Búsqueda de términos que distingue mayúsculas y minúsculas

Tip

Búsqueda de String exacta respetando mayúsculas y minúsculas.

Tip

Búsqueda de términos negados sensible a mayúsculas y minúsculas

Tip

Distinción de diacríticas

Búsqueda de términos sensibles a diacríticos

Tip

Búsqueda de términos negados sensibles a diacríticos

Tip

Ejemplos de puntuación de relevancia

Devuelva la puntuación de relevancia

Tip

Ordenar por puntuación de relevancia

Tip

Devolver los 2 documentos coincidentes principales

Tip

Combina $text con otras operaciones de query y ordenamiento

Tip

`$search` Campo