Observação
Este tutorial usa a biblioteca JavaScript da LangChain. Para um tutorial que utiliza a biblioteca Python, consulte LangChain Python.
Você pode integrar o MongoDB Vector Search ao LangChain para criar aplicativos LLM e implementar a geração aumentada de recuperação (RAG). Este tutorial demonstra como começar a usar o MongoDB Vector Search com o LangChain para realizar a pesquisa semântica em seus dados e criar uma implementação RAG. Especificamente, você executa as seguintes ações:
Configure o ambiente.
Armazene dados personalizados no MongoDB.
Crie um índice do MongoDB Vector Search em seus dados.
Execute as seguintes query de pesquisa vetorial:
Pesquisa semântica.
Pesquisa semântica com pré-filtragem de metadados.
Atlas Search de máxima relevância secundária (MMR).
Implemente o RAG usando o MongoDB Vector Search para responder a perguntas sobre seus dados.
Plano de fundo
LangChain é uma estrutura de código aberto que simplifica a criação de aplicativos LLM por meio do uso de "cadeias". As cadeias são componentes específicos do LangChain que podem ser combinados para uma variedade de casos de uso de IA, incluindo RAG.
Ao integrar o MongoDB Vector Search com o LangChain, você pode usar o MongoDB como um banco de dados vetorial e usar o MongoDB Vector Search para implementar RAG, recuperando documentos semanticamente semelhantes de seus dados. Para saber mais sobre RAG, consulte Geração Aumentada de Recuperação (RAG) com MongoDB.
Pré-requisitos
Para concluir este tutorial, você deve ter o seguinte:
Um dos seguintes tipos de cluster MongoDB :
Um cluster do Atlas executando a versão 6.0.11 do MongoDB, 7.0.2, ou posterior. Certifique-se de que seu endereço IP esteja incluído na lista de acesso do seu projeto Atlas.
Um sistema local do Atlas criado utilizando o Atlas CLI. Para saber mais, consulte Criar uma implantação de Atlas local.
Um cluster MongoDB Community ou Enterprise com Search e Vector Search instalados.
Uma chave de API do Voyage AI. Para criar uma chave de API, consulte Chaves de API do modelo.
Observação
Suas solicitações de API podem falhar se você não tiver um método de pagamento configurado no Atlas (para chave de API criada na interface do usuário do Atlas ) ou Voyage AI (para chave de API criada diretamente da Voyage AI).
Uma chave de API da OpenAI. Você deve ter uma conta da OpenAI com créditos disponíveis para solicitações de API. Para aprender mais sobre como registrar uma conta OpenAI, consulte o website de API OpenAI.
Um editor de terminal e código para executar seu projeto Node.js.
npm e Node.js instalados.
Configurar o ambiente
Configure o ambiente para este tutorial. Para configurar seu ambiente, conclua as etapas a seguir.
Atualize seu arquivo package.json.
Configure seu projeto para usar módulos ES adicionando "type": "module" ao seu arquivo package.json e salvando-o.
{ "type": "module", // other fields... }
Crie um arquivo denominado get-started.js e cole o seguinte código.
Em seu projeto, crie um arquivo chamado get-started.js e, em seguida, copie e cole o seguinte código no arquivo. Você adicionará código a esse arquivo durante o tutorial.
Este trecho de código inicial importa os pacotes necessários para este tutorial, define variáveis de ambiente e estabelece uma conexão com seu cluster MongoDB .
import { MongoClient } from "mongodb"; import { MongoDBAtlasVectorSearch } from "@langchain/mongodb"; import { ChatOpenAI } from "@langchain/openai"; import { VoyageEmbeddings } from "@langchain/community/embeddings/voyage"; import { PDFLoader } from "@langchain/community/document_loaders/fs/pdf"; import { PromptTemplate } from "@langchain/core/prompts"; import { RecursiveCharacterTextSplitter } from "@langchain/textsplitters"; import { RunnableSequence, RunnablePassthrough } from "@langchain/core/runnables"; import { StringOutputParser } from "@langchain/core/output_parsers"; import * as fs from 'fs'; process.env.VOYAGEAI_API_KEY = "<api-key>" process.env.OPENAI_API_KEY = "<api-key>"; process.env.MONGODB_URI = "<connection-string>"; const client = new MongoClient(process.env.MONGODB_URI); const formatDocumentsAsString = (docs) => docs.map(d => d.pageContent).join("\n\n");
Substitua os valores do espaço reservado.
Para concluir a configuração do ambiente, substitua <api-key> os <connection-string> valores de espaço reservado e em por get-started.js sua chave de API do Voyage AI, sua chave de API do OpenAI e a string de conexão SRVpara seu cluster do MongoDB , respectivamente. Sua string de conexão deve usar o seguinte formato:
mongodb+srv://<db_username>:<db_password>@<clusterName>.<hostname>.mongodb.net
Use o MongoDB como um armazenamento de vetores
Nesta seção, você define uma função assíncrona para carregar dados personalizados no MongoDB e instanciar seu cluster MongoDB como um banco de dados vetorial, também chamado de armazenamento vetorial. Adicione o seguinte código ao seu arquivo get-started.js.
Observação
Para este tutorial, utilize um documento PDF acessível ao público intitulado Melhores práticas do MongoDB Atlas como fonte de dados para o seu armazenamento de vetores. Este documento descreve várias recomendações e conceitos principais para gerenciar seus sistemas do MongoDB .
Este código executa as seguintes ações:
Configura sua collection MongoDB especificando os seguintes parâmetros:
langchain_db.testcomo a coleção MongoDB para armazenar os documentos.vector_indexcomo o índice a ser usado para consultar o armazenamento de vetores.textcomo o nome do campo que contém o conteúdo de texto bruto.embeddingcomo o nome do campo que contém as incorporações do vetor.
Prepara seus dados personalizados fazendo o seguinte:
Recupera dados brutos da URL especificada e os salva como PDF.
Usa um divisor de texto para divisão os dados em documentos menores.
Especifica os parâmetros de parte, que determinam o número de caracteres em cada documento e o número de caracteres que devem se sobrepor entre dois documentos consecutivos.
Cria um armazenamento de vetor a partir dos documentos de amostra chamando o método
MongoDBAtlasVectorSearch.fromDocuments. Este método especifica os seguintes parâmetros:O documento de amostra a serem armazenados no reconhecimento de data center vetorial.
Modelo de incorporação da Voyage AI como modelo usado para converter texto em incorporações vetoriais para o campo
embedding.Sua configuração do cluster MongoDB .
async function run() { try { // Configure your MongoDB collection const database = client.db("langchain_db"); const collection = database.collection("test"); const dbConfig = { collection: collection, indexName: "vector_index", // The name of the MongoDB Search index to use. textKey: "text", // Field name for the raw text content. Defaults to "text". embeddingKey: "embedding", // Field name for the vector embeddings. Defaults to "embedding". }; // Ensure that the collection is empty const count = await collection.countDocuments(); if (count > 0) { await collection.deleteMany({}); } // Save online PDF as a file const rawData = await fetch("https://webassets.mongodb.com/MongoDB_Best_Practices_Guide.pdf"); const pdfBuffer = await rawData.arrayBuffer(); const pdfData = Buffer.from(pdfBuffer); fs.writeFileSync("atlas_best_practices.pdf", pdfData); // Load and split the sample data const loader = new PDFLoader(`atlas_best_practices.pdf`); const data = await loader.load(); const textSplitter = new RecursiveCharacterTextSplitter({ chunkSize: 200, chunkOverlap: 20, }); const docs = await textSplitter.splitDocuments(data); // Instantiate MongoDB as a vector store const embeddingModel = new VoyageEmbeddings({ modelName: "voyage-4" }); embeddingModel.apiUrl = 'https://ai.mongodb.com/v1/embeddings'; const vectorStore = await MongoDBAtlasVectorSearch.fromDocuments(docs, embeddingModel, dbConfig); } finally { // Ensure that the client will close when you finish/error await client.close(); } } run().catch(console.dir);
Salve o arquivo e execute o seguinte comando para carregar seus dados no MongoDB.
node get-started.js
Dica
Depois de executar get-started.js, se estiver usando o Atlas, poderá verificar suas incorporações vetoriais navegando até o namespace langchain_db.test na interface do usuário do Atlas.
Crie o índice de Vector Search do MongoDB
Para habilitar consultas de pesquisa de vetor em seu armazenamento de vetor, crie um índice do MongoDB Vector Search na coleção langchain_db.test .
Defina o índice do MongoDB Vector Search .
Adicione o seguinte código no final da declaração
tryda função assíncrona que você definiu no seu arquivoget-started.js. Este código cria um índice do tipo vectorSearch para indexar os seguintes campos:embeddingcampo como o tipo de vetor. Oembeddingcampo contém os embeddings criados usando o modelo de embeddingvoyage-4do Voyage AI. A definição de índice especifica1024dimensões vetoriais e mede a similaridade usandocosine.loc.pageNumbercampo como o tipo de filtro para pré-filtrar dados pelo número da página no PDF.
Este código também usa uma função await para garantir que seu índice de pesquisa tenha sido sincronizado com seus dados antes de ser usado.
1 // Ensure index does not already exist, then create your MongoDB Vector Search index 2 const indexes = await collection.listSearchIndexes("vector_index").toArray(); 3 if(indexes.length === 0){ 4 5 // Define your MongoDB Vector Search Index 6 const index = { 7 name: "vector_index", 8 type: "vectorSearch", 9 definition: { 10 "fields": [ 11 { 12 "type": "vector", 13 "numDimensions": 1024, 14 "path": "embedding", 15 "similarity": "cosine" 16 }, 17 { 18 "type": "filter", 19 "path": "loc.pageNumber" 20 } 21 ] 22 } 23 } 24 25 // Run the helper method 26 const result = await collection.createSearchIndex(index); 27 console.log(result); 28 } 29 30 // Wait for index to build and become queryable 31 console.log("Waiting for initial sync..."); 32 await new Promise(resolve => setTimeout(() => { 33 resolve(); 34 }, 3000)); Salve o arquivo.
Executar queries no Vector Search
Esta seção demonstra várias queries que você pode executar em seus dados vetorizados. Agora que você criou o índice, adicione o seguinte código à sua função assíncrona para executar queries do Atlas Search vetorial em seus dados.
Observação
Se você tiver resultados imprecisos ao consultar seus dados, seu índice pode estar demorando mais do que o esperado para sincronizar. Aumente o número na função setTimeout para permitir mais tempo para a sincronização inicial.
Adicione o seguinte código à sua função assíncrona e salve o arquivo.
O código a seguir usa o método similaritySearch para executar uma pesquisa semântica básica para a string MongoDB Atlas security. Ele retorna uma lista de documentos classificados por relevância com apenas os campos pageContent e pageNumber.
// Basic semantic search const basicOutput = await vectorStore.similaritySearch( "MongoDB Atlas security" ); const basicResults = basicOutput.map((results => ({ pageContent: results.pageContent, pageNumber: results.metadata.loc.pageNumber, }))) console.log("Semantic Search Results:") console.log(basicResults) if (basicResults.length === 0) { console.log("No results found after waiting for index sync. Check Atlas Search index status and embedding configuration."); }
Execute o seguinte comando para executar a query.
node get-started.js
Semantic Search Results: [ { pageContent: 'read isolation. \n' + 'With MongoDB Atlas, you can achieve workload isolation with dedicated analytics nodes. Visualization \n' + 'tools like Atlas Charts can be configured to read from analytics nodes only.', pageNumber: 21 }, { pageContent: 'well-tuned queries.\n' + 'Built-in slow query profiling is also available if you’re deploying MongoDB with Atlas.', pageNumber: 16 }, { pageContent: 'Atlas free tier, or download MongoDB for local \n' + 'development.\n' + 'Review the MongoDB manuals and tutorials in our \n' + 'documentation. \n' + 'More Resources\n' + 'For more on getting started in MongoDB:', pageNumber: 30 }, { pageContent: 'If you are running MongoDB on your own infrastructure, you can configure replica set tags to achieve \n' + 'read isolation.', pageNumber: 21 } ]
Você pode pré-filtrar seus dados usando uma expressão de correspondência MQL que compara o campo indexado com outro valor em sua coleção. Você deve indexar todos os campos de metadados que deseja filtrar como o tipo filter . Para aprender mais, consulte Como indexar campos da pesquisa vetorial.
Observação
Você especificou o campo loc.pageNumber como um filtro quando criou o índice para este tutorial.
Adicione o seguinte código à sua função assíncrona e salve o arquivo.
O código a seguir usa o método similaritySearch para executar uma pesquisa semântica para a string MongoDB Atlas security. Ele especifica os seguintes parâmetros:
O número de documentos a retornar como
3.Um pré-filtro no campo
loc.pageNumberque usa o operador$eqpara corresponder aos documentos que aparecem somente na página 17 .
Ele retorna uma lista de documentos classificados por relevância com apenas os campos pageContent e pageNumber.
// Semantic search with metadata filter const filteredOutput = await vectorStore.similaritySearch("MongoDB Atlas Search", 3, { preFilter: { "loc.pageNumber": {"$eq": 22 }, } }); const filteredResults = filteredOutput.map((results => ({ pageContent: results.pageContent, pageNumber: results.metadata.loc.pageNumber, }))) console.log("Semantic Search with Filtering Results:") console.log(filteredResults)
Execute o seguinte comando para executar a query.
node get-started.js
Semantic Search with Filtering Results: [ { pageContent: 'Atlas Search is built for the MongoDB document data model and provides higher performance and', pageNumber: 22 }, { pageContent: 'Figure 9: Atlas Search queries are expressed through the MongoDB Query API and backed by the leading search engine library, \n' + 'Apache Lucene.', pageNumber: 22 }, { pageContent: 'consider using Atlas Search. The service is built on fully managed Apache Lucene but exposed to users \n' + 'through the MongoDB Aggregation Framework.', pageNumber: 22 } ]
Você também pode realizar pesquisas semânticas com base na Relevância Marginal Máxima (MMR), uma medida de relevância semântica otimizada para a diversidade.
Adicione o seguinte código à sua função assíncrona e salve o arquivo.
O código a seguir usa o método maxMarginalRelevanceSearch para pesquisar a string MongoDB Atlas security. Ele também especifica um objeto que define os seguintes parâmetros opcionais:
kpara limitar o número de documentos retornados a3.fetchKpara buscar apenas10documentos antes de passá-los para o algoritmo MMR .
Ele retorna uma lista de documentos classificados por relevância com apenas os campos pageContent e pageNumber.
// Max Marginal Relevance search const mmrOutput = await vectorStore.maxMarginalRelevanceSearch("MongoDB Atlas security", { k: 3, fetchK: 10, }); const mmrResults = mmrOutput.map((results => ({ pageContent: results.pageContent, pageNumber: results.metadata.loc.pageNumber, }))) console.log("Max Marginal Relevance Search Results:") console.log(mmrResults)
Execute o seguinte comando para executar a query.
node get-started.js
Max Marginal Relevance Search Results: [ { pageContent: 'Atlas Search is built for the MongoDB document data model and provides higher performance and', pageNumber: 22 }, { pageContent: '• Zoned Sharding — You can define specific rules governing data placement in a sharded cluster.\n' + 'Global Clusters in MongoDB Atlas allows you to quickly implement zoned sharding using a visual UI or', pageNumber: 27 }, { pageContent: 'read isolation. \n' + 'With MongoDB Atlas, you can achieve workload isolation with dedicated analytics nodes. Visualization \n' + 'tools like Atlas Charts can be configured to read from analytics nodes only.', pageNumber: 21 } ]
Dica
Para obter mais informações, consulte a referência da API.
Responda a perguntas sobre seus dados
Esta seção demonstra duas implementações diferentes de RAG usando o MongoDB Vector Search e o LangChain. Agora que você usou a Vector Search do MongoDB para recuperar documentos semanticamente semelhantes, use os exemplos de código a seguir para solicitar que o LLM responda às perguntas dos documentos retornados pela Vector Search do MongoDB .
Adicione o seguinte código à sua função assíncrona e salve o arquivo.
Este código faz o seguinte:
Instancia o MongoDB Vector Search como um recuperador para consultar documentos semanticamente semelhantes.
Define um modelo de prompt do LangChain para instruir o LLM a usar esses documentos como contexto para sua query. O LangChain passa esses documentos para a variável de entrada
{context}e sua query para a variável{question}.Constrói uma cadeia que usa o modelo de chat da OpenAI para gerar respostas sensíveis ao contexto com base em sua solicitação.
Solicita a cadeia com uma query de amostra sobre as recomendações de segurança do Atlas .
Retorna a resposta do LLM e os documentos usados como contexto.
// Implement RAG to answer questions on your data const retriever = vectorStore.asRetriever(); const prompt = PromptTemplate.fromTemplate(`Answer the question based on the following context: {context} Question: {question}`); const model = new ChatOpenAI({ modelName: "gpt-5-mini" }) // Pick your preferred model. Ensure to enable it in your OpenAI settings dashboard. const chain = RunnableSequence.from([ { context: retriever.pipe(formatDocumentsAsString), question: new RunnablePassthrough(), }, prompt, model, new StringOutputParser(), ]); // Prompt the LLM const question = "How can I secure my MongoDB Atlas cluster?"; const answer = await chain.invoke(question); console.log("Question: " + question); console.log("Answer: " + answer); // Return source documents const retrievedResults = await retriever.invoke(question) const documents = retrievedResults.map((documents => ({ pageContent: documents.pageContent, pageNumber: documents.metadata.loc.pageNumber, }))) console.log("\nSource documents:\n" + JSON.stringify(documents, null, 2))
Execute o seguinte comando para executar seu arquivo.
Depois de salvar o arquivo, execute o seguinte comando. A resposta gerada pode variar.
node get-started.js
Question: How can I secure my MongoDB Atlas cluster? Answer: You can secure your MongoDB Atlas cluster by achieving workload isolation with dedicated analytics nodes, configuring visualization tools like Atlas Charts to read from analytics nodes only, and using built-in slow query profiling if deploying with Atlas. Additionally, you can distribute replica set members across multiple data centers for added security during election and failover. Source documents: [ { "pageContent": "read isolation. \nWith MongoDB Atlas, you can achieve workload isolation with dedicated analytics nodes. Visualization \ntools like Atlas Charts can be configured to read from analytics nodes only.", "pageNumber": 21 }, { "pageContent": "If you are running MongoDB on your own infrastructure, you can configure replica set tags to achieve \nread isolation.", "pageNumber": 21 }, { "pageContent": "well-tuned queries.\nBuilt-in slow query profiling is also available if you’re deploying MongoDB with Atlas.", "pageNumber": 16 }, { "pageContent": "achieved during election and failover. \nIf possible, distribute replica set members across multiple data centers. If you’re using MongoDB Atlas,", "pageNumber": 24 } ]
Adicione o seguinte código à sua função assíncrona e salve o arquivo.
Este código faz o seguinte:
Instancia o MongoDB Vector Search como um recuperador para consultar documentos semanticamente semelhantes. Ela também especifica os seguintes parâmetros opcionais:
searchTypecomommr, que especifica que o MongoDB Vector Search recupera documentos com base na Relevância Máx. (MMR).filterpara adicionar um pré-filtro no campoloc.pageNumberpara incluir documentos que aparecem apenas na página 17.Os seguintes parâmetros específicos do MMR:
fetchKpara buscar apenas20documentos antes de passá-los para o algoritmo MMR .lambda, um valor entre0e1para determinar o grau de diversidade entre os resultados, com0representando a diversidade máxima e1representando a diversidade mínima.
Define um modelo de prompt do LangChain para instruir o LLM a usar esses documentos como contexto para sua query. O LangChain passa esses documentos para a variável de entrada
{context}e sua query para a variável{question}.Constrói uma cadeia que usa o modelo de chat da OpenAI para gerar respostas sensíveis ao contexto com base em sua solicitação.
Solicita a cadeia com uma query de amostra sobre as recomendações de segurança do Atlas .
Retorna a resposta do LLM e os documentos usados como contexto.
// Implement RAG to answer questions on your data const retriever = await vectorStore.asRetriever({ searchType: "mmr", // Defaults to "similarity" filter: { preFilter: { "loc.pageNumber": { "$eq": 17 } } }, searchKwargs: { fetchK: 20, lambda: 0.1, }, }); const prompt = PromptTemplate.fromTemplate(`Answer the question based on the following context: {context} Question: {question}`); const model = new ChatOpenAI({}); const chain = RunnableSequence.from([ { context: retriever.pipe(formatDocumentsAsString), question: new RunnablePassthrough(), }, prompt, model, new StringOutputParser(), ]); // Prompt the LLM const question = "How can I secure my MongoDB Atlas cluster?"; const answer = await chain.invoke(question); console.log("Question: " + question); console.log("Answer: " + answer); // Return source documents const retrievedResults = await retriever.invoke(question) const documents = retrievedResults.map((documents => ({ pageContent: documents.pageContent, pageNumber: documents.metadata.loc.pageNumber, }))) console.log("\nSource documents:\n" + JSON.stringify(documents, null, 2))
Execute o seguinte comando para executar seu arquivo.
Depois de salvar o arquivo, execute o seguinte comando. A resposta gerada pode variar.
node get-started.js
Question: How can I secure my MongoDB Atlas cluster? Answer: One way to secure your MongoDB Atlas cluster is by implementing proper access controls and ensuring that only authorized users have access to your data. You can also enable encryption at rest and in transit, use network security features such as VPC peering, and regularly update and patch your MongoDB database to protect against security vulnerabilities. Additionally, implementing auditing and monitoring tools can help you detect and respond to any security incidents in a timely manner. Source documents: [ { "pageContent": "Optimizing Data \nAccess Patterns\nNative tools in MongoDB for improving query \nperformance and reducing overhead.", "pageNumber": 17 } ]
Próximos passos
Para saber como integrar a Vector Search do MongoDB ao LangGraph, consulte Integrar o MongoDB ao LangGraph.js.
O MongoDB também fornece os seguintes recursos para desenvolvedores: