Generación aumentada por recuperación (RAG) con Voyage AI

La API de incrustación y reclasificación está disponible Vista previa. La función y la documentación correspondiente pueden cambiar en cualquier momento durante el período de vista previa.

La generación aumentada por recuperación (RAG) es una arquitectura que utiliza búsqueda semántica para ampliar los modelos de lenguaje grandes (LLM) con datos adicionales, lo que les permite generar respuestas más precisas.

Mientras que la búsqueda semántica recupera documentos relevantes basados en el significado, RAG lleva esto un paso más allá al proporcionar esos documentos recuperados como contexto a un LLM. Este contexto adicional ayuda al LLM a generar una respuesta más precisa a la query de un usuario, reduciendo las alucinaciones. Voyage IA proporciona modelos de embedding y reranking de primer nivel para potenciar la recuperación en tus aplicaciones RAG.

Para probar RAG sin programar, usa Playground para crear un chatbot de IA con Voyage AI. Para más información, consulta Chatbot Demo Builder.

haga clic para ampliar

Tutorial

El siguiente tutorial demuestra cómo implementar RAG con incrustaciones de Voyage.

También puedes trabajar con el código de este tutorial clonando el repositorio de GitHub.

Idioma

Proveedor de LLM

Almacenamiento vectorial

¿Por qué utilizar RAG?

Al trabajar con LLM, es posible que encuentres las siguientes limitaciones:

Datos obsoletos: Los LLM se entrenan con un conjunto de datos estáticos hasta cierto punto. Esto significa que tienen una base de conocimiento limitada y podrían usar datos obsoletos.
Sin acceso a datos adicionales: Los LLM no tienen acceso a datos locales, personalizados ni específicos de su dominio. Por lo tanto, pueden carecer de conocimientos sobre dominios específicos.
Alucinaciones: Al utilizar datos incompletos u obsoletos, los LLM pueden generar respuestas inexactas.

RAG aborda estas limitaciones añadiendo un paso de recuperación, generalmente basado en búsqueda semántica, para obtener documentos relevantes en tiempo real. Proporcionar contexto adicional ayuda a los LLM a generar respuestas más precisas. Esto convierte a RAG en una arquitectura eficaz para crear chatbots de IA que ofrecen respuestas a preguntas personalizadas y específicas del dominio, así como generación de texto.

¿Qué son las bases de datos vectoriales?

Las bases de datos vectoriales son bases de datos especializadas diseñadas para almacenar y recuperar eficientemente incrustaciones vectoriales. Si bien el almacenamiento de vectores en memoria es adecuado para el prototipado y la experimentación, las aplicaciones RAG de producción suelen requerir una base de datos vectorial para realizar una recuperación eficiente de un corpus más amplio.

MongoDB ofrece compatibilidad nativa con el almacenamiento y la recuperación de vectores, lo que lo convierte en una opción práctica para almacenar y buscar incrustaciones vectoriales junto con otros datos. Para obtener más información, consulte Descripción general de la búsqueda de vectores de MongoDB.

Próximos pasos

Para obtener tutoriales adicionales, consulte los siguientes recursos:

Para aprender a implementar RAG con marcos LLM y servicios de IA populares, consulte Integraciones de IA de MongoDB.
Para crear agentes de IA e implementar RAG agentic,consulte Crear agentes de IA con MongoDB.

Volver

Búsqueda semántica

Tokenización