Prueba rápidamente la MongoDB Vector Search en el MongoDB Search Playground usando un RAG chatbot que responde preguntas sobre tus datos con búsqueda vectorial. El Constructor de demostraciones de chatbot en el MongoDB Search Playground te permite aportar tus propios datos, probar diferentes estrategias de fragmentación, generar incrustaciones utilizando los modelos de incrustación de Voyage IA y hacer preguntas sobre los datos sin una cuenta, clúster o colección de Atlas. También puedes compartir un enlace a un snapshot de tu MongoDB Search Playground con otras personas.
Etapas utilizadas
El generador de demostraciones de chatbot utiliza dos etapas del pipeline de agregación, $vectorSearch y $project.
Considerations
Este es un chatbot de IA generativa. Toda la información debe ser verificada antes de su uso. No suba datos confidenciales. MongoDB registra los datos de su carga de trabajo para la supervisión de la salud del sistema y ayudar a resolver cualquier problema en el Generador de demostración del chatbot.
Limitaciones del generador de demostraciones de chatbots
El generador de demostraciones del Chatbot procesa el archivo PDF importado o el texto copiado y pegado como una fuente de conocimiento única y unificada. No se puede definir ni combinar colecciones de datos separadas en el generador.
El Chatbot Demo Builder utiliza un índice de búsqueda vectorial preconfigurado que no es editable. La query se genera en función de la configuración de recuperación especificada y no se puede editar directamente utilizando el editor de código.
El entorno de Chatbot Demo Builder no persiste. Para guardar un entorno, usa el Share botón para generar una snapshot URL que persiste por 30 días.
El Generador de Demostraciones de Chatbot solo admite incrustaciones basadas en texto. Si tu archivo PDF contiene imágenes, el chatbot no podrá procesar ni responder preguntas sobre el contenido de esas imágenes.
El Constructor de Demos de Chatbot presenta las siguientes limitaciones de datos:
No puedes importar archivos de más de 100 MB.
El límite total de caracteres no puede exceder los 100,000 caracteres.
No se pueden utilizar sus propios embeddings vectoriales ni credenciales de API para soluciones de embeddings.
Prueba el creador de demostraciones de chatbots
Accede al Chatbot Demo Builder.
Navegue hasta Chatbot Demo Builder.
Selecciona tu fuente de datos.
El Chatbot Demo Builder ofrece tres opciones de fuentes de datos.
Upload PDF | Sube un archivo PDF desde tu dispositivo local con un tamaño máximo de 100 MB. Si la cantidad de caracteres supera los 100,000, debes usar solo los primeros 100,000 caracteres o subir un archivo con menos caracteres. Puede previsualizar el texto con SEE TEXT. |
Copy & Paste Text | Copie y pegue texto hasta 100,000 caracteres. Si el recuento de caracteres supera los 100,000, solo debes usar los primeros 100,000 caracteres o reducir el tamaño del texto. |
Sample Data | Utiliza los datos de muestra proporcionados por MongoDB, que es un PDF sobre un parque ficticio. |
El Generador de Demostraciones de Chatbot es una demostración pública. No suba datos confidenciales.
Configura la procesamiento de datos.
Personaliza la configuración de fragmentación y el modelo de incrustación.
Chunking strategy | Elige Recursive Chunking (opción por defecto) o Fixed Token Count with Overlap.
Para obtener más información sobre las estrategias de fragmentación, consulte Estrategias de fragmentación. |
Chunk size | Defina la cantidad de tokens por fragmento. La cantidad de tokens debe ser al menos el double de la cantidad de sobreposición entre fragmentos.
|
Chunk overlap | Especifique el tamaño de la superposición de tokens entre fragmentos adyacentes. El tamaño de solapamiento debe ser como máximo la mitad del tamaño del fragmento.
|
Embedding model | Seleccione uno de los siguientes modelos de incrustación:
|
Para modificar estas opciones después de crear embeddings, utiliza el panel lateral DATA SETTINGS. Cambiar la configuración borra el historial de chat anterior.
Haz preguntas sobre tus datos y edita la configuración de recuperación.
Cada par de pregunta y respuesta es independiente, sin depender de interacciones anteriores. Cuando seleccionas Share, el área de pruebas (playground) guarda tus configuraciones de datos y ajustes de recuperación. El historial de preguntas y respuestas no se guarda ni se puede compartir.
Para cada pregunta que realices, el Generador de Demos de Chatbot muestra las siguientes configuraciones:
Configuración o salida | Ubicación en la página | Descripción |
|---|---|---|
Search Query | Vinculado en el chat con respuesta | Ver la sintaxis de query de MongoDB Vector Search. |
[number] DOCUMENTS | Vinculado en el chat con respuesta | Vea los documentos recuperados al ejecutar la consulta de búsqueda y cómo se califican los resultados. |
Data to Evaluate (numCandidates) | Panel lateral derecho | Ajuste el número de coincidencias potenciales que el sistema revisa para seleccionar el mejor resultado. Para buscar exhaustivamente en todas las unificaciones vectoriales indexadas, haz clic en la casilla de verificación Evaluate all [number] documents (ENN). Esto puede afectar la latencia de la query. |
Data to Retrieve (limit) | Panel lateral derecho | Ajusta el número de documentos (fragmentos) devueltos. |
Data Source | Bottom panel tab | Vea sus datos como MongoDB Documents o Full Extracted Text. |
Index Definition | Bottom panel tab | Consulte la definición generada del índice de MongoDB Vector Search. |
Search Query | Bottom panel tab | Ver la sintaxis de query de MongoDB Vector Search utilizada para la pregunta y respuesta más recientes. |
LLM & Prompt | Bottom panel tab | Ver los grandes modelos de lenguaje (LLM) utilizados. |
Nota
El rendimiento de Chatbot Demo Builder puede diferir del rendimiento en producción.
Más información
Para aprender más sobre los queries de búsqueda vectorial, consulta Ejecutar consultas de búsqueda vectorial. Para obtener más información sobre la generación de recuperación aumentada (RAG), consulta Generación de recuperación aumentada (RAG) con MongoDB.