Pruebe rápidamente MongoDB Vector Search en MongoDB Search Playground usando un RAG chatbot que responde preguntas sobre tus datos con búsqueda vectorial. El Constructor de demostraciones de chatbot en el MongoDB Search Playground te permite aportar tus propios datos, probar diferentes estrategias de fragmentación, generar incrustaciones utilizando los modelos de incrustación de Voyage IA y hacer preguntas sobre los datos sin una cuenta, clúster o colección de Atlas. También puedes compartir un enlace a un snapshot de tu MongoDB Search Playground con otras personas.
Etapas utilizadas
El generador de demostraciones de chatbot utiliza dos etapas del pipeline de agregación, $vectorSearchy.$project
Considerations
Este es un chatbot de IA generativa. Toda la información debe ser verificada antes de su uso. No suba datos confidenciales. MongoDB registra los datos de su carga de trabajo para la supervisión de la salud del sistema y ayudar a resolver cualquier problema en el Generador de demostración del chatbot.
Limitaciones del generador de demostraciones de chatbots
El Generador de Demos de Chatbot procesa el archivo PDF importado o el texto copiado y pegado como una única fuente de conocimiento unificada. No se pueden definir ni combinar conjuntos de datos independientes dentro del generador.
El Chatbot Demo Builder utiliza un índice de búsqueda vectorial preconfigurado que no es editable. La query se genera en función de la configuración de recuperación especificada y no se puede editar directamente utilizando el editor de código.
El entorno de Chatbot Demo Builder no se conserva. Para guardar un entorno, utilice el Share botón para generar una snapshot URL que persiste durante 30 días.
El Generador de Demostraciones de Chatbot solo admite incrustaciones basadas en texto. Si tu archivo PDF contiene imágenes, el chatbot no podrá procesar ni responder preguntas sobre el contenido de esas imágenes.
El Constructor de Demos de Chatbot presenta las siguientes limitaciones de datos:
No puedes importar archivos de más de 100 MB.
El límite total de caracteres no puede exceder los 100,000 caracteres.
No se pueden utilizar sus propios embeddings vectoriales ni credenciales de API para soluciones de embeddings.
Pruebe el constructor de demostraciones de Chatbot
Accede al Chatbot Demo Builder.
Navegue hasta Chatbot Demo Builder.
Seleccione su fuente de datos.
El Chatbot Demo Builder ofrece tres opciones de fuentes de datos.
Upload PDF | Sube un archivo PDF desde tu dispositivo local con un tamaño máximo de 100 MB. Si la cantidad de caracteres supera los 100,000, debes usar solo los primeros 100,000 caracteres o subir un archivo con menos caracteres. Puede previsualizar el texto con SEE TEXT. |
Copy & Paste Text | Copie y pegue texto hasta 100,000 caracteres. Si el recuento de caracteres supera los 100,000, solo debes usar los primeros 100,000 caracteres o reducir el tamaño del texto. |
Sample Data | Utiliza los datos de muestra proporcionados por MongoDB, que es un PDF sobre un parque ficticio. |
El Generador de Demostraciones de Chatbot es una demostración pública. No suba datos confidenciales.
Configura la procesamiento de datos.
Personalice su configuración de fragmentación y modelo de incrustación.
Chunking strategy | Elige Recursive Chunking (opción por defecto) o Fixed Token Count with Overlap.
Para obtener más información sobre las estrategias de fragmentación, consulte Estrategias de fragmentación. |
Chunk size | Defina la cantidad de tokens por fragmento. La cantidad de tokens debe ser al menos el double de la cantidad de sobreposición entre fragmentos.
|
Chunk overlap | Especifique el tamaño de la superposición de tokens entre fragmentos adyacentes. El tamaño de solapamiento debe ser como máximo la mitad del tamaño del fragmento.
|
Embedding model | Seleccione uno de los siguientes modelos de incrustación:
|
Para modificar estas opciones después de crear embeddings, utiliza el panel lateral DATA SETTINGS. Cambiar la configuración borra el historial de chat anterior.
Haz preguntas sobre tus datos y edita la configuración de recuperación.
Cada par de pregunta y respuesta es independiente, sin depender de interacciones anteriores. Cuando seleccionas Share, el área de pruebas (playground) guarda tus configuraciones de datos y ajustes de recuperación. El historial de preguntas y respuestas no se guarda ni se puede compartir.
Para cada pregunta que realices, el Generador de Demos de Chatbot muestra las siguientes configuraciones:
Configuración o salida | Ubicación en la página | Descripción |
|---|---|---|
Search Query | Vinculado en el chat con respuesta | Ver la sintaxis de consulta de búsqueda vectorial de MongoDB. |
[number] DOCUMENTS | Vinculado en el chat con respuesta | Vea los documentos recuperados al ejecutar la consulta de búsqueda y cómo se califican los resultados. |
Data to Evaluate (numCandidates) | Panel lateral derecho | Ajuste el número de coincidencias potenciales que revisa el sistema para seleccionar el mejor resultado. Para buscar exhaustivamente todas las incrustaciones vectoriales indexadas, marque la casilla Evaluate all [number] documents (ENN). Esto puede afectar la latencia de la consulta. |
Data to Retrieve (limit) | Panel lateral derecho | Ajustar la cantidad de documentos (fragmentos) devueltos. |
Data Source | Bottom panel tab | Vea sus datos como MongoDB Documents o Full Extracted Text. |
Index Definition | Bottom panel tab | Consulte la definición generada del índice de MongoDB Vector Search. |
Search Query | Bottom panel tab | Ver la sintaxis de query de MongoDB Vector Search utilizada para la pregunta y respuesta más recientes. |
LLM & Prompt | Bottom panel tab | Ver el Modelo de Lenguaje Grande (LLM) utilizado. |
Nota
El rendimiento del Chatbot Demo Builder puede diferir del rendimiento de producción.
Más información
Para obtener más información sobre las consultas de búsqueda vectorial, consulte Ejecutar consultas de búsqueda vectorial. Para obtener más información sobre la Generación Aumentada por Recuperación (RAG), consulte Generación Aumentada por Recuperación (RAG) con MongoDB.