/ /

Compila un agente de IA con LangGraph y MongoDB Atlas

Puede integrar MongoDB Atlas con LangGraph para crear agentes de IA. Este tutorial muestra cómo crear un agente de IA que responde preguntas sobre datos de muestra en MongoDB.

En concreto, el agente utiliza la integración para implementar RAG y memoria de agente. Utiliza herramientas de búsqueda semántica y de texto completo para recuperar información relevante y responder preguntas sobre los datos. También implementa memoria a corto y largo plazo mediante MongoDB, almacenando el historial de conversaciones y las interacciones importantes en colecciones separadas.

El código de esta página crea una aplicación de ejemplo completa. También puedes trabajar con el código como... Cuaderno de Python Si prefieres aprender paso a paso.

Requisitos previos

Para completar este tutorial, debes tener lo siguiente:

Uno de los siguientes tipos de clúster de MongoDB:
- Un clúster Atlas que ejecute MongoDB 6.0.11 versión, 7.0.2 o posterior. Asegúrese de que su Ladirección IP está incluida en la lista de acceso de su proyecto Atlas.
- Una implementación local de Atlas creada usando Atlas CLI. Para obtener más información, consulta Crear una Implementación local de Atlas.
- Un clúster de MongoDB Community o Enterprise con Search y Vector Search instalados.
Una clave API de Voyage AI. Para obtener más información, consulte Clave API y cliente Python.
Una llave de API de OpenAI. Debes tener una cuenta de OpenAI con créditos disponibles para las solicitudes de API. Para obtener más información sobre cómo registrar una cuenta de OpenAI, consulta el sitio web de la API de OpenAI.

Nota

Consulte los requisitos del paquete langchain-voyageai para asegurarse de que está utilizando una versión de Python compatible.

Configurar el entorno

Para configurar el entorno, complete los siguientes pasos:

Inicialice el proyecto e instale las dependencias.

Cree un nuevo directorio de proyecto y luego instale las dependencias necesarias:

mkdir langgraph-mongodb-ai-agent
cd langgraph-mongodb-ai-agent
pip install --quiet --upgrade python-dotenv langgraph langgraph-checkpoint-mongodb langgraph-store-mongodb langchain langchain-mongodb langchain-voyageai langchain-openai pymongo

Nota

Su proyecto utilizará la siguiente estructura:

langgraph-mongodb-ai-agent
├── .env
├── config.py
├── search-tools.py
├── memory-tools.py
├── agent.py
├── main.py

Establecer variables de entorno.

Crear una .env Archivo en su proyecto y especifique las siguientes variables. Reemplace los valores de marcador de posición con claves API válidas y la cadena de conexión de su clúster MongoDB.

VOYAGE_API_KEY = "<voyage-api-key>"
OPENAI_API_KEY = "<openai-api-key>"
MONGODB_URI = "<connection-string>"

Nota

Se debe sustituir <connection-string> por la cadena de conexión del clúster Atlas o de la implementación local de Atlas.

Su cadena de conexión debe usar el siguiente formato:

mongodb+srv://<db_username>:<db_password>@<clusterName>.<hostname>.mongodb.net

Para obtener más información,consulte Conectarse a un clúster a través de bibliotecas de cliente.

Su cadena de conexión debe usar el siguiente formato:

mongodb://localhost:<port-number>/?directConnection=true

Para obtener más información, consulta Cadenas de conexión.

Utilice MongoDB como base de datos vectorial

Para configurar MongoDB como una base de datos vectorial para almacenamiento y recuperación, complete los siguientes pasos:

Cargue los datos de muestra.

En este tutorial, utilizará uno de nuestros conjuntos de datos de muestra como fuente de datos. Si aún no lo ha hecho, complete los pasos para cargar datos de muestra en su clúster Atlas.

En concreto, utilizará el conjunto de datos embedded_movies, que contiene documentos sobre películas, incluidas las incrustaciones vectoriales de sus gráficos.

Nota

Si desea utilizar sus propios datos, consulte Introducción a LangChain o Cómo crear incrustaciones vectoriales para aprender a ingerir incrustaciones vectoriales en Atlas.

Configurar el almacén de vectores y los índices.

Cree un archivo llamado config.py en su proyecto. Este archivo configura MongoDB como almacén de vectores para su agente. También crea los índices para habilitar la búsqueda de vectores y las consultas de texto completo en los datos de muestra.

config.py

Se debe copiar y pegar el siguiente código en el archivo config.py.

import os
from pymongo import MongoClient
from langchain_mongodb import MongoDBAtlasVectorSearch
from langchain_mongodb.index import create_fulltext_search_index
from langchain_voyageai import VoyageAIEmbeddings
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv
# Load environment variables
load_dotenv()
# Get required environment variables
MONGODB_URI = os.getenv("MONGODB_URI")
if not MONGODB_URI:
    raise ValueError("MONGODB_URI environment variable is required")
# Initialize models
embedding_model = VoyageAIEmbeddings(
    model="voyage-3-large",
    output_dimension=2048
)
llm = ChatOpenAI("gpt-4o")
# MongoDB setup
mongo_client = MongoClient(MONGODB_URI)
collection = mongo_client["sample_mflix"]["embedded_movies"]
# LangChain vector store setup
vector_store = MongoDBAtlasVectorSearch.from_connection_string(
    connection_string=MONGODB_URI,
    namespace="sample_mflix.embedded_movies",
    embedding=embedding_model,
    text_key="plot",
    embedding_key="plot_embedding_voyage_3_large",
    relevance_score_fn="dotProduct",
)
# Create indexes on startup
print("Setting up vector store and indexes...")
try:
    existing_indexes = list(collection.list_search_indexes())
    vector_index_exists = any(idx.get('name') == 'vector_index' for idx in existing_indexes)
    if vector_index_exists:
        print("Vector search index already exists, skipping creation...")
    else:
        print("Creating vector search index...")
        vector_store.create_vector_search_index(
            dimensions=2048,  # The dimensions of the vector embeddings to be indexed
            wait_until_complete=60  # Number of seconds to wait for the index to build (can take around a minute)
        )
        print("Vector search index created successfully!")
except Exception as e:
    print(f"Error creating vector search index: {e}")
try:
    fulltext_index_exists = any(idx.get('name') == 'search_index' for idx in existing_indexes)
    if fulltext_index_exists:
        print("Search index already exists, skipping creation...")
    else:
        print("Creating search index...")
        create_fulltext_search_index(
            collection=collection,
            field="title",
            index_name="search_index",
            wait_until_complete=60  # Number of seconds to wait for the index to build (can take around a minute)
        )
        print("Search index created successfully!")
except Exception as e:
    print(f"Error creating search index: {e}")

Definir herramientas de búsqueda

Cree un search_tools.py archivo en su proyecto. En este archivo, defina las herramientas de búsqueda que el agente utiliza para realizar la RAG agentica.

herramientas_de_búsqueda.py

Copie y pegue el siguiente código en su archivo search_tools.py.

plot_searchEsta herramienta utiliza el objeto de almacén vectorial como recuperador. En segundo plano, el recuperador ejecuta una consulta de búsqueda vectorial de MongoDB para recuperar documentos semánticamente similares. A continuación, la herramienta devuelve los títulos y las tramas de los documentos de películas recuperados.
title_searchEsta herramienta utiliza el recuperador de texto completo para recuperar documentos de películas que coinciden con el título especificado. A continuación, devuelve la trama de la película especificada.

from langchain.agents import tool
from langchain_mongodb.retrievers.full_text_search import MongoDBAtlasFullTextSearchRetriever
from config import vector_store, collection
@tool
def plot_search(user_query: str) -> str:
    """
    Retrieve information on the movie's plot to answer a user query by using vector search.
    """
    
    retriever = vector_store.as_retriever(
        search_type="similarity",
        search_kwargs={"k": 5}  # Retrieve top 5 most similar documents
    )
    results = retriever.invoke(user_query)
   
    # Concatenate the results into a string
    context = "\n\n".join([f"{doc.metadata['title']}: {doc.page_content}" for doc in results])
    return context
@tool
def title_search(user_query: str) -> str:
    """
    Retrieve movie plot content based on the provided title by using full-text search.
    """
    
    # Initialize the retriever
    retriever = MongoDBAtlasFullTextSearchRetriever(
        collection=collection,            # MongoDB Collection
        search_field="title",             # Name of the field to search
        search_index_name="search_index", # Name of the MongoDB Search index
        top_k=1,                          # Number of top results to return       
    ) 
    results = retriever.invoke(user_query)
   
    for doc in results:
        if doc:
            return doc.metadata["fullplot"]
        else:
            return "Movie not found"
# List of search tools
SEARCH_TOOLS = [ plot_search, title_search ]

Nota

Puede definir cualquier herramienta necesaria para realizar una tarea específica. También puede definir herramientas para otros métodos de recuperación, como la búsqueda híbrida o la recuperación de documentos principales.

Define Memory Tools

Cree un memory_tools.py archivo en su proyecto. En este archivo, defina las herramientas que el agente puede usar para almacenar y recuperar interacciones importantes entre sesiones e implementar la memoria a largo plazo.

herramientas_de_memoria.py

Copie y pegue el siguiente código en su archivo memory_tools.py.

store_memory:Esta herramienta utiliza el almacén MongoDB de LangGraph para almacenar interacciones importantes en una colección MongoDB.
retrieve_memory:Esta herramienta utiliza el almacén MongoDB de LangGraph para recuperar interacciones relevantes en función de la consulta mediante la búsqueda semántica.

from langchain.agents import tool
from langgraph.store.mongodb import MongoDBStore, create_vector_index_config
from config import embedding_model, MONGODB_URI
# Vector search index configuration for memory collection
index_config = create_vector_index_config(
    embed=embedding_model,
    dims=2048,
    relevance_score_fn="dotProduct",
    fields=["content"]
)
@tool
def save_memory(content: str) -> str:
    """Save important information to memory."""
    with MongoDBStore.from_conn_string(
        conn_string=MONGODB_URI,
        db_name="sample_mflix",
        collection_name="memories",
        index_config=index_config,
        auto_index_timeout=60 # Wait a minute for vector index creation
    ) as store:
        store.put(
            namespace=("user", "memories"),
            key=f"memory_{hash(content)}",
            value={"content": content}
        )
    return f"Memory saved: {content}"
@tool
def retrieve_memories(query: str) -> str:
    """Retrieve relevant memories based on a query."""
    with MongoDBStore.from_conn_string(
        conn_string=MONGODB_URI,
        db_name="sample_mflix",
        collection_name="memories",
        index_config=index_config
    ) as store:
        results = store.search(("user", "memories"), query=query, limit=3)
    if results:
        memories = [result.value["content"] for result in results]
        return f"Retrieved memories:\n" + "\n".join(memories)
    return "No relevant memories found."
MEMORY_TOOLS = [save_memory, retrieve_memories]

Construya el agente con persistencia

Cree un agent.py archivo en su proyecto. En este archivo, creará el gráfico que organiza el flujo de trabajo del agente. Este agente utiliza el componente MongoDB Checkpointer para implementar la memoria a corto plazo, lo que permite múltiples conversaciones simultáneas con historiales separados.

El agente utiliza el siguiente flujo de trabajo para responder a las queries:

Inicio: El agente recibe una consulta del usuario.
Nodo de agente: el LLM vinculado a herramientas analiza la consulta y determina si se necesitan herramientas.
Nodo de herramientas (si es necesario): ejecuta las herramientas de búsqueda o de memoria adecuadas.
Fin: El LLM genera una respuesta final utilizando la salida de las herramientas.

Diagrama que muestra el flujo de trabajo del agente LangGraph-MongoDB.

haga clic para ampliar

agent.py

Copia y pega el siguiente código en tu archivo agent.py.

La implementación del agente consta de varios componentes:

LangGraphAgent:Clase de agente principal que orquesta el flujo de trabajo
build_graph:Construye el flujo de trabajo LangGraph y configura el puntero de control MongoDBSaver para la persistencia de la memoria a corto plazo
agent_node:Principal tomador de decisiones que procesa los mensajes y determina el uso de las herramientas.
tools_node:Ejecuta las herramientas solicitadas y devuelve resultados
route_tools:Función de enrutamiento condicional que determina la dirección del flujo de trabajo
execute: Punto de entrada principal que acepta un parámetro thread_id para el seguimiento de hilos de conversación

from typing import Annotated, Dict, List
from typing_extensions import TypedDict
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.messages import ToolMessage
from langgraph.graph import StateGraph, START, END
from langgraph.graph.message import add_messages
from langgraph.checkpoint.mongodb import MongoDBSaver
from config import llm, mongo_client
from search_tools import SEARCH_TOOLS
from memory_tools import MEMORY_TOOLS
# Define the graph state
class GraphState(TypedDict):
    messages: Annotated[list, add_messages]
# Define the LangGraph agent
class LangGraphAgent:
    def __init__(self):
        # Combine search tools with memory tools
        self.tools = SEARCH_TOOLS + MEMORY_TOOLS
        self.tools_by_name = {tool.name: tool for tool in self.tools}
        
        # Create prompt template
        self.prompt = ChatPromptTemplate.from_messages([
            (
                "system",
                "You are a helpful AI chatbot."
                " You are provided with tools to answer questions about movies."
                " Think step-by-step and use these tools to get the information required to answer the user query."
                " Do not re-run tools unless absolutely necessary."
                " If you are not able to get enough information using the tools, reply with I DON'T KNOW."
                " You have access to the following tools: {tool_names}."
            ),
            MessagesPlaceholder(variable_name="messages"),
        ])
        
        # Provide the tool names to the prompt
        self.prompt = self.prompt.partial(tool_names=", ".join([tool.name for tool in self.tools]))
        
        # Prepare the LLM with tools
        bind_tools = llm.bind_tools(self.tools)
        self.llm_with_tools = self.prompt | bind_tools
        
        # Build the graph
        self.app = self._build_graph()
    
    def _build_graph(self):
        """Build and compile the LangGraph workflow."""
        # Instantiate the graph
        graph = StateGraph(GraphState)
        
        # Add nodes
        graph.add_node("agent", self._agent_node)
        graph.add_node("tools", self._tools_node)
        
        # Add edges
        graph.add_edge(START, "agent")
        graph.add_edge("tools", "agent")
        
        # Add conditional edge
        graph.add_conditional_edges(
            "agent",
            self._route_tools,
            {"tools": "tools", END: END},
        )
        # Use the MongoDB checkpointer for short-term memory
        checkpointer = MongoDBSaver(mongo_client, db_name = "sample_mflix")
        return graph.compile(checkpointer=checkpointer)
    
    def _agent_node(self, state: GraphState) -> Dict[str, List]:
        """Agent node that processes messages and decides on tool usage."""
        messages = state["messages"]
        result = self.llm_with_tools.invoke(messages)
        return {"messages": [result]}
    
    def _tools_node(self, state: GraphState) -> Dict[str, List]:
        """Tools node that executes the requested tools."""
        result = []
        messages = state["messages"]
        if not messages:
            return {"messages": result}
        last_message = messages[-1]
        if not hasattr(last_message, "tool_calls") or not last_message.tool_calls:
            return {"messages": result}
        tool_calls = last_message.tool_calls
        # Show which tools the agent chose to use
        tool_names = [tool_call["name"] for tool_call in tool_calls]
        print(f"🔧 Agent chose to use tool(s): {', '.join(tool_names)}")
        for tool_call in tool_calls:
            try:
                tool_name = tool_call["name"]
                tool_args = tool_call["args"]
                tool_id = tool_call["id"]
                print(f"   → Executing {tool_name}")
                
                if tool_name not in self.tools_by_name:
                    result.append(ToolMessage(content=f"Tool '{tool_name}' not found", tool_call_id=tool_id))
                    continue
                tool = self.tools_by_name[tool_name]
                observation = tool.invoke(tool_args)
                result.append(ToolMessage(content=str(observation), tool_call_id=tool_id))
            except Exception as e:
                result.append(ToolMessage(content=f"Tool error: {str(e)}", tool_call_id=tool_id))
        return {"messages": result}
    
    def _route_tools(self, state: GraphState):
        """
        Uses a conditional_edge to route to the tools node if the last message
        has tool calls. Otherwise, route to the end.
        """
        messages = state.get("messages", [])
        if len(messages) > 0:
            ai_message = messages[-1]
        else:
            raise ValueError(f"No messages found in input state to tool_edge: {state}")
        
        if hasattr(ai_message, "tool_calls") and len(ai_message.tool_calls) > 0:
            return "tools"
        return END
    
    def execute(self, user_input: str, thread_id: str) -> str:
        """Execute the graph with user input."""
        input_data = {"messages": [("user", user_input)]}
        config = {"configurable": {"thread_id": thread_id}}
        outputs = list(self.app.stream(input_data, config))
        # Get the final answer
        if outputs:
            final_output = outputs[-1]
            for _, value in final_output.items():
                if "messages" in value and value["messages"]:
                    return value["messages"][-1].content
        return "No response generated."

Acerca del flujo de trabajo

Expanda esta sección para obtener detalles sobre los componentes LangGraph utilizados en el agente.

Este gráfico incluye los siguientes componentes clave:

Estado del gráfico: mantiene datos compartidos durante todo el flujo de trabajo, rastreando los mensajes del agente, incluidas las consultas del usuario, las respuestas deLLM y los resultados de las llamadas a herramientas.
Nodes:
- Nodo agente: procesa mensajes, invoca el LLM y actualiza el estado con respuestas del LLM
- Nodo de herramientas: procesa las llamadas a herramientas y actualiza el historial de conversaciones con los resultados.
Edges, que conectan nodos:
- Aristas normales: Ruta desde el inicio hasta el nodo del agente y del agente al nodo de herramientas
- Borde condicional: enruta condicionalmente dependiendo de si se necesitan herramientas
Persistencia: Utiliza el MongoDBSaver puntero de control para guardar el estado de la conversación en hilos específicos, lo que permite la memoria a corto plazo entre sesiones. Puede encontrar los datos del hilo en las checkpoints checkpoint_writes colecciones y.

Tip

Para obtener más información sobre la persistencia, la memoria a corto plazo y el puntero de control de MongoDB, consulte los siguientes recursos:

Ejecutar el agente

Por último, se debe crear un archivo llamado main.py en el proyecto. Este archivo ejecuta el agente y permite interactuar con él.

main.py

Se debe copiar y pegar el siguiente código en el archivo main.py.

from agent import LangGraphAgent
from config import mongo_client
def main():
    """LangGraph and MongoDB agent with tools and memory."""
    # Initialize agent (indexes are created during config import)
    agent = LangGraphAgent()
    thread_id = input("Enter a session ID: ").strip()
    print("Ask me about movies! Type 'quit' to exit.")
    try:
        while True:
            user_query = input("\nYour question: ").strip()
            if user_query.lower() == 'quit':
                break
            # Get response from agent
            answer = agent.execute(user_query, thread_id)
            print(f"\nAnswer: {answer}")
    finally:
        mongo_client.close()
if __name__ == "__main__":
    main()

Guardar el proyecto y luego ejecutar el siguiente comando. Cuando se ejecute el agente:

El agente inicializa el almacén de vectores y crea los índices si aún no existen.
Puedes introducir un ID de sesión para iniciar una nueva sesión o continuar una existente. Cada sesión se conserva y siempre puedes reanudar una conversación anterior.
Haz preguntas sobre películas. El agente genera una respuesta basada en tus herramientas e interacciones previas.

La siguiente salida demuestra una interacción de muestra:

python main.py

Creating vector search index...
Vector search index created successfully!
Creating search index...
Search index created successfully!
Enter a session ID: 123
Ask me about movies! Type 'quit' to exit.
Your query: What are some movies that take place in the ocean?
🔧 Agent chose to use tool(s): plot_search
   → Executing plot_search
Answer: Here are some movies that take place in the ocean:
1. **20,000 Leagues Under the Sea** - A marine biologist, his daughter, and a mysterious Captain Nemo explore the ocean aboard an incredible submarine.
2. **Deep Rising** - A group of armed hijackers board a luxury ocean liner in the South Pacific Ocean, only to fight man-eating, tentacled sea creatures.
... (truncated)
Your query: What is the plot of the Titanic?
🔧 Agent chose to use tool(s): title_search
   → Executing title_search
Answer: The plot of *Titanic* involves the romantic entanglements of two couples aboard the doomed ship's maiden voyage
... (truncated)
Your query: What movies are like the movie I just mentioned?
🔧 Agent chose to use tool(s): plot_search
   → Executing plot_search
Answer: Here are some movies similar to *Titanic*:
1. **The Poseidon Adventure** - A group of passengers struggles to survive when their ocean liner capsizes at sea.
2. **Pearl Harbor** - Focused on romance and friendship amidst the backdrop of a historical tragedy, following two best friends and their love lives during wartime.
... (truncated)
Your query: I don't like sad movies.
🔧 Agent chose to use tool(s): save_memory
   → Executing save_memory
Answer: Got it—I'll keep that in mind. Let me know if you'd like recommendations that focus more on uplifting or happy themes!
(In different session)
Enter a session ID: 456
Your query: Recommend me a movie based on what you know about me.
🔧 Agent chose to use tool(s): retrieve_memories
   → Executing retrieve_memories
Answer: Based on what I know about you—you don't like sad movies—I'd recommend a fun, uplifting, or action-packed film. Would you be interested in a comedy, adventure, or family-friendly movie?
Your query: Sure!
🔧 Agent chose to use tool(s): plot_search, plot_search, plot_search
   → Executing plot_search
   → Executing plot_search
   → Executing plot_search
Answer: Here are some movie recommendations from various uplifting genres that suit your preferences:
### Comedy:
1. **Showtime** (2002): A spoof of buddy cop movies where two very different cops are forced to team up on a new reality-based TV cop show. It's packed with laughs and action!
2. **The Big Bus** (1976): A hilarious disaster film parody featuring a nuclear-powered bus going nonstop from New York to Denver, plagued by absurd disasters.
### Adventure:
1. **Journey to the Center of the Earth** (2008): A scientist, his nephew, and their mountain guide discover a fantastic and dangerous lost world at the earth's core.
2. **Jason and the Argonauts** (1963): One of the most legendary adventures in mythology, brought to life in this epic saga of good versus evil.
### Family-Friendly:
1. **The Incredibles** (2004): A family of undercover superheroes is forced into action to save the world while living in quiet suburban life.
2. **Mary Poppins** (1964): A magical nanny brings joy and transformation to a cold banker's unhappy family.
3. **Chitty Chitty Bang Bang** (1968): A whimsical adventure featuring an inventor, his magical car, and a rescue mission filled with fantasy.

Volver

LangGraph

LangGraph.js

Requisitos previos

Nota

Configurar el entorno

Inicialice el proyecto e instale las dependencias.

Nota

Establecer variables de entorno.

Nota

Utilice MongoDB como base de datos vectorial

Cargue los datos de muestra.

Nota

Configurar el almacén de vectores y los índices.

config.py

Definir herramientas de búsqueda

herramientas_de_búsqueda.py

Nota

Define Memory Tools

herramientas_de_memoria.py

Construya el agente con persistencia

agent.py

Acerca del flujo de trabajo

Tip

Ejecutar el agente

main.py

Obtén una insignia de habilidad