El whitespace El analizador divide el texto en términos de búsqueda (tokens) donde encuentra un espacio en blanco. Deja todo el texto en su forma original.
Si seleccionas Refine Your IndexLa interfaz de usuario de Atlas muestra una sección titulada View text analysis of your selected index configuration dentro de la sección Index Configurations. Al expandir esta sección, la interfaz de usuario de Atlas muestra los tokens de índice y búsqueda que el analizador whitespace genera para cada cadena de muestra. Puede ver los tokens que el analizador whitespace crea para un documento de muestra integrado y una cadena de consulta al crear o editar un índice en la interfaz de usuario de Atlas Visual Editor.
Importante
MongoDB Search no indexará campos de cadena cuyos tokens del analizador superen 32766 bytes. Si se usa la palabra clave "analizer", los campos de cadena que superen 32766 bytes no se indexarán.
Ejemplo
La siguiente definición de índice de ejemplo especifica un índice en el campo title en el Colecciónsample_mflix.movies con el whitespace analizador. Para seguir este ejemplo, cargue los datos de muestra en su clúster y utilice mongosh o navegue a la Create a Search
Index página en la interfaz de usuario de Atlas siguiendo los pasos del tutorial Crear un índice de búsqueda de MongoDB.
Luego, utilizando la movies colección como fuente de datos, siga el procedimiento de ejemplo para crear un índice desde mongosh o la interfaz de usuario de Atlas Visual Editor o.JSON editor
➤ Utilice el menú desplegable Seleccione su idioma para configurar la interfaz para el ejemplo de esta página.
Se debe hacer clic en Refine Your Index para configurar el índice.
En la sección Index Configurations, alterna Dynamic Mapping a off.
En la sección Field Mappings, haz clic en Add Field para abrir la ventana Add Field Mapping.
Selecciona
titledel menú desplegable Field Name.Haga clic en Customized Configuration.
Haga clic en el menú desplegable Data Type y seleccione String si aún no está seleccionado.
Expande String Properties y realiza los siguientes cambios:
Analizador de índices
Selecciona
lucene.whitespacedel menú desplegable.Analizador de búsqueda
Selecciona
lucene.whitespacedel menú desplegable.Opciones del índice
Usa el
offsetspor defecto.Store
Usa el
truepor defecto.Ignorar lo anterior
Mantener la configuración predeterminada.
Normas
Usa el
includepor defecto.Haga clic en Add.
Haga clic en Save Changes.
Haga clic en Create Search Index.
Reemplazar la definición predeterminada del índice con la siguiente definición del índice.
{ "mappings": { "fields": { "title": { "type": "string", "analyzer": "lucene.whitespace", "searchAnalyzer": "lucene.whitespace" } } } } Haga clic en Next.
Haga clic en Create Search Index.
1 db.movies.createSearchIndex( 2 "default", 3 { 4 "mappings": { 5 "fields": { 6 "title": { 7 "type": "string", 8 "analyzer": "lucene.whitespace", 9 "searchAnalyzer": "lucene.whitespace" 10 } 11 } 12 } 13 } 14 )
La siguiente consulta busca el término Lion's en el campo title.
Haga clic en el botón Query para su índice.
Haga clic en Edit Query para editar la consulta.
Haga clic en la barra de consulta y seleccione la base de datos y la colección.
Reemplace la consulta predeterminada por la siguiente y haga clic en Find:
[ { "$search": { "text": { "query": "Lion's", "path": "title" } } } ] SCORE: 3.7370920181274414 _id: "573a13ebf29313caabdcfc8d" awards: Object cast: Array (4) countries: Array (1) directors: Array (1) fullplot: "A documentary on young actress, Marianna Palka, as she confronts her r…" genres: Array (3) imdb: Object languages: Array (1) lastupdated: "2015-09-03 00:37:45.227000000" num_mflix_comments: 0 plot: "A documentary on young actress, Marianna Palka, as she confronts her r…" poster: "https://m.media-amazon.com/images/M/MV5BMTgzMTc2OTg2N15BMl5BanBnXkFtZT…" released: 2014-01-18T00:00:00.000+00:00 runtime: 15 title: "The Lion's Mouth Opens" type: "movie" writers: Array (1) year: 2014
db.movies.aggregate([ { "$search": { "text": { "query": "Lion's", "path": "title" } } }, { "$project": { "_id": 0, "title": 1 } } ])
[ { title: "The Lion's Mouth Opens" } ]
MongoDB Search devuelve estos documentos haciendo lo siguiente para el texto en el campo title usando el analizador lucene.whitespace:
Conserve el formato de letra original para el texto.
Divide el texto en tokens dondequiera que encuentre un carácter de espacio en blanco.
La siguiente tabla muestra los tokens (términos de búsqueda) que MongoDB Search crea utilizando el Analizador de espacios en blanco y, por el contrario, el Analizador simple y el Analizador de palabras clave para los documentos en los resultados:
Título | Tokens del analizador de espacios en blanco | Tokens de analizador simple | Tokens del analizador de palabras clave |
|---|---|---|---|
|
|
|
|
El índice que utiliza el analizador whitespace distingue entre mayúsculas y minúsculas. Por lo tanto, MongoDB Search puede relacionar el término de consulta Lion's con el token Lion's creado por el analizador whitespace.