Puedes integrar Vertex AI con MongoDB Atlas para compilar e implementar aplicaciones de IA. La plataforma Vertex AI incluye varias herramientas y modelos preentrenados de Google que puedes usar con Atlas para RAG y otros casos de uso, como consultas en lenguaje natural.
Overview
Vertex AI permite una variedad de casos de uso con MongoDB Atlas:
Utilice modelos base de Google con MongoDB Vector Search para compilar aplicaciones de IA e implementar RAG. Para obtener más información, consulte Modelos de Google.
Utiliza las extensiones de Vertex AI para personalizar cómo los modelos de Google interactúan con Atlas. Para comenzar, consulta Usar las Extensiones Vertex IA para queries MongoDB de lenguaje natural.
Utiliza el motor de agentes Vertex AI para construir y escalar agentes de IA con Atlas como base de datos. Para empezar, consulta Compila agentes de IA con Vertex AI Agent Engine y Atlas.
Empezar
La siguiente aplicación de muestra demuestra cómo utilizar Vertex IA con Atlas para RAG. La aplicación incluye una interfaz que te permite cargar documentos PDF y responder preguntas sobre los datos de PDF utilizando MongoDB Vector Search y modelos Vertex IA.
Requisitos previos
Antes de iniciar este tutorial, debes tener lo siguiente:
Se requiere un clúster de Atlas que ejecute MongoDB 6.0.11 versión, 7.0.2 o posterior. Asegúrese de que su dirección IP esté incluida en la lista de acceso de su proyecto de Atlas.
Acceso a un proyecto de Google Cloud con Vertex IA API habilitado. Para obtener más información, consulte la documentación de Google Cloud.
Crea una instancia de Google Cloud Compute
Sigue los pasos en la documentación de Google Cloud para crear e iniciar una instancia de máquina virtual (VM) en tu consola de Google Cloud. Configura la instancia de Google Cloud VM con la siguiente configuración y usa la configuración por defecto para el resto de las opciones:
Opción | Configuración |
|---|---|
Nombre |
|
Región y zona | Cualquier región y zona de Google Cloud cercana a tu ubicación física |
Configuración de la máquina |
|
Disco de arranque | Size100 GB |
Acceso | Permitir acceso total a todas las API de nube |
cortafuegos | Seleccionar todo |
Gestión de redes | Para el rango de IP externas, especifique Reserve external static IP address |
Implementa y ejecuta la aplicación
Esta sección carga una aplicación de muestra que podéis usar para transformar y almacenar PDFs en Atlas y consultar utilizando MongoDB Vector Search. Para implementar y ejecutar la aplicación en tu instancia de VM de Google Cloud, deberá completar los siguientes pasos:
Crea un índice de MongoDB Vector Search.
Tienes que crear un índice de MongoDB Vector Search llamado vector_index en el namespace vertexaiApp.chat-vec en tu clúster de Atlas para habilitar las queries sobre tus embeddings vectoriales. Utiliza la configuración por defecto y especifica las dimensiones 768.
Para obtener más información, consulte Cómo indexar campos para la búsqueda vectorial.
Obtené la aplicación de muestra.
Conecte a la instancia de VM usando SSH. En el entorno, clona el repositorio de GitHub que contiene el código de la aplicación:
git clone https://github.com/mongodb-partners/MongoDB-VertexAI-Qwiklab.git
Nota
Para saber más sobre la aplicación, consulta el repositorio.
Sube documentos PDF usando la interfaz de la aplicación.
En la aplicación, sube los datos PDF que quieres buscar.
El repositorio incluye un archivo PDF de muestra que puedes utilizar. La aplicación divide los datos en lotes, convierte cada fragmento en un embedding vectorial utilizando un modelo de embedding de Vertex IA y aloja estos datos en tu colección de Atlas.
Tip
Después de cargar el archivo, si estás utilizando Atlas, puedes verificar tus incrustaciones de vectores navegando al namespace vertexaiApp.chat-vec en la Interfaz de Usuario de Atlas.
Responde preguntas sobre tus datos.
En la aplicación, haga clic en la pestaña Q&A.
Ingresa una pregunta en la barra de búsqueda y, después, presiona Enter.
La aplicación realiza RAG ejecutando una query de búsqueda vectorial en tu colección para recuperar los documentos más relevantes, y luego utiliza un modelo de chat de Vertex AI para generar una respuesta contextualizada.