Sugerencias relevantes a medida que escribe

Añada sugerencias rápidas y relevantes mientras escribe en su aplicación, incorporando el contexto del usuario y los factores de clasificación específicos del dominio.

caso de uso: Gestión de contenidos, Catálogo

Industrias: Comercio minorista

Productos: MongoDB Atlas, Búsqueda vectorialde MongoDB Atlas

Resumen de la solución

La funcionalidad as-you-type, también conocida como autocompletar, autocompletar o búsqueda predictiva, a menudo se refiere a la coincidencia de caracteres de bajo nivel, en lugar de una solución integral diseñada para un propósito específico. Esta funcionalidad le ayuda a navegar rápidamente hacia el contenido deseado y relevante. Buscar la película "The Matrix" escribiendo "matr" en la barra de búsqueda es un ejemplo de funcionalidad mientras se escribe.

La búsqueda vectorial y la búsqueda de texto completo son muy buenas para hacer coincidir contenido semánticamente cuando hay una query completa o coincidencias de palabras muy cercanas. Sin embargo, una funcionalidad integrada de autocompletado puede devolver resultados relevantes con incluso menos caracteres y mayor distancia entre la entrada de texto y la palabra clave objetivo. Esta solución basada en léxico facilita la coincidencia parcial y proporciona resultados pertinentes sensibles al contexto.

Arquitecturas de Referencia

La solución de sugerencia mientras escribes es arquitectónicamente sencilla. Mientras escribe, las solicitudes se envían a Atlas Search, que devuelve resultados relevantes. La arquitectura está estructurada en torno a un entities colección y las correspondientes consultas.

Arquitectura de solución según se escribe

haga clic para ampliar

Figura 1. Arquitectura de solución justo cuando escribes

Enfoque de modelo de datos

Cada sugerencia presentada al usuario representa una entidad única de su dominio. Las entidades deben modelarse como documentos individuales en una colección especializada, optimizada para la sugestibilidad a medida que escribe.

La colección principal suele representar un tipo de entidad como documentos, y otras entidades de dominio como campos de metadatos o documentos incrustados. Por ejemplo, considera usar los datos de películas de muestra disponibles en Atlas. Mientras escribes, la búsqueda sugiere nombres de películas. Sin embargo, también puedes buscar nombres de miembros del reparto. Por ejemplo, puedes encontrar películas protagonizadas por Keanu Reeves con solo escribir "kea".

El modelo de datos tiene el siguiente esquema:

_idID único para esta colección en la forma <type>-<natural id>.
type: tipo de entidad/tipo de objeto Realm, p. ej. película, marca, persona, producto y categoría.
nameel nombre o título de la entidad, que generalmente sería único por tipo.

Es importante que los documentos de entidad tengan identificadores únicos y estables, ya que las entidades se actualizan periódicamente desde la colección principal. Asignar un type a cada entidad permite filtrar (sugerir solo miembros del elenco en una búsqueda específica por actor), agrupar (organizar las sugerencias por tipo) o potenciar por tipo (dar mayor importancia a las películas que a los nombres de los miembros del elenco).

Modelar entidades directamente como documentos individuales permite que cada una tenga campos de metadatos opcionales para ayudar en la clasificación, visualización, filtrado o agrupación de los mismos.

El modelo orientado a documentos envía el campo name a través de una configuración de índice sofisticada, que divide los valores de varias formas adecuadas para su consulta en distintas maneras. El poder de esta solución proviene de la unión de múltiples estrategias de indexación y consulta.

{
   "_id":"title-The Matrix",
   "name":"The Matrix",
   "type":"title"
}

Compilar la solución

En primer lugar, identifica las entidades sugeribles en tus datos. En el escenario de las películas, estos incluirían títulos de películas, nombres de miembros del elenco y, quizás, también géneros y nombres de directores.

La base de este sistema de sugerencias a medida que se escribe es la siguiente:

Cree una colección entities y rellénela con el esquema modelado anteriormente. Actualice la colección entities con la frecuencia necesaria.
Crear un Atlas Search entities_index usando una configuración de índice como se describe a continuación.
Crea un sólido conjunto de cláusulas de consulta, junto con cualquier factor de impulso pertinente, dentro de una pipeline de agregación que utilice $search.

Entidades importadoras

Si bien hay varias formas de completar la entities colección, una forma sencilla de hacerlo es ejecutar una secuencia de agregación en la colección principal para incorporar los títulos únicos de todas las películas:

[
   {
      $group: {
         _id: "$title",
      },
   },
   {
      $project: {
         _id: {$concat: [ "title", "-", "$_id" ]},
         type: "title",
         name: "$_id"
      }
   },
   { $merge: { into: "entities" } }
]

La etapa $project convierte cada título de película único en el esquema entities necesario. Como esta colección tipifica cada documento, el type se codifica como un prefijo del _id generado y se agrega con el título real de la película, creando un identificador reproducible para cada título único. Incluir type en los identificadores de la entidad permite que diferentes tipos de entities con el mismo nombre sean independientes unos de otros (podría haber una película llamada “Aventura” así como el género “Aventura”).

Finalmente, la etapa $merge agrega todos los títulos nuevos y deja intactos los existentes.

El documento resultante con las tipografías del título para “The Matrix” queda simplemente así:

{
   "_id":"title-The Matrix",
   "name":"The Matrix",
   "type":"title"
}

Cada tipo de entidad necesita potencialmente su propia técnica para fusionarse en la colección entities, como en el caso de las entidades "género" y "elenco", que necesitan desenrollarse de sus matrices anidadas usando $unwind.

La importación de entidades específicas de este reparto incluye a “Keanu Reeves” como:

{
   "_id":"cast-Keanu Reeves",
   "name":"Keanu Reeves",
   "type":"cast",
   "weight": 6.637
}

Indexación de Entidades

El campo name se indexa de diversas maneras, lo que facilitará la coincidencia parcial y la clasificación al momento de la query.

Figura 2. Estrategias de indexación múltiples

La función de analizadores múltiples utiliza la configuración del índice Atlas Search para permitir que un solo campo de documento se indexe de múltiples maneras.

El campo type se indexa como un campo token, para filtrar equals o in, y como un campo stringFacet para proporcionar un medio para obtener recuentos de los resultados de cada tipo de entidad.

La definición del índice gestiona cualquier otro campo añadido además de _id, type y name, ya sea mediante mapeo dinámico o con las definiciones estáticas que proporciones. En este ejemplo, weight es personalizado y manejado dinámicamente como un tipo numérico.

Buscando sugerencias

El índice de búsqueda especializado resultante sienta las bases para las consultas sobre la marcha. El campo name se indexa de diversas maneras y se compara con la escritura de los usuarios mediante diversos operadores de consulta ajustables. La idea es comparar los operadores de consulta con las diferentes asignaciones analizadas y ver qué coincide. Cuantas más coincidencias se encuentren, mayor será la puntuación de la sugerencia. Cada cláusula de consulta se puede incrementar y sumar de forma independiente, lo que proporciona una puntuación de relevancia para la entidad coincidente. Estas puntuaciones podrían incrementarse aún más mediante otros factores, como un campo de entidad opcional weight.

Ejemplo de cálculo de consulta y puntuación de relevancia

haga clic para ampliar

Figura 3. Ejemplo de query y cálculo de puntuación de relevancia

En general, un usuario que selecciona una sugerencia realiza a continuación una búsqueda tradicional específica para el artículo seleccionado. La búsqueda devuelve entonces todos los elementos coincidentes.

Visite el repositorio de GitHub a esta solución.

Lecciones clave

Utiliza una configuración de índice especializada para modelar entidades sugestionables como documentos: Sigue los pasos anteriores para crear una colección independiente que contenga todas las entidades de cualquier fuente.
Crear un índice con estas configuraciones: Utiliza estos ajustes de índice en tu colección principal cuando todos los modelos sugieran entidades sugeribles como documentos de primer nivel.
Utiliza la estructura del índice para crear consultas ingeniosas: Utiliza tu índice para hacer coincidir entidades y clasificar sugerencias como desees.

Autores

Erik Hatcher, MongoDB

Obtén más información

Volver

Búsqueda de productos de IA

Chatbot impulsado por IA para la gestión de redes