A geração aumentada por recuperação (RAG) é uma arquitetura que usa a pesquisa semântica para aumentar os modelos de linguagem grandes (LLMs) com dados adicionais, permitindo que gerem respostas mais precisas.
Enquanto a pesquisa semântica recupera documentos relevantes com base no significado, o RAG leva isso um passo além, fornecendo esses documentos recuperados como contexto para um LLM. Esse contexto adicional ajuda o LLM a gerar uma resposta mais precisa à consulta de um usuário, reduzindo as atordoamentos. A Voyage AI fornece os melhores modelos de incorporação e reclassificação da classe para a recuperação de energia para seus aplicativos RAG.
Para experimentar o RAG sem escrever nenhum código, use o Playground para criar um chatbot de IA com a tecnologia Voyage AI. Para saber mais, consulte Construtor de demonstração do chatbot.

Tutorial
O tutorial a seguir demonstra como implementar o RAG com incorporações do Voyage.
Você também pode trabalhar com o código deste tutorial clonando o repositório do GitHub.
Por que usar a RAG?
Ao usar LLMs, você pode encontrar as seguintes limitações:
Dados obsoletos: os LLMs são formados em um conjunto de dados estático até um determinado ponto no tempo. Isso significa que eles têm uma base de conhecimento limitada e podem usar dados desatualizados.
Sem acesso a dados adicionais: os LLMs não têm acesso a dados locais, personalizados ou específicos do domínio. Portanto, eles podem não ter conhecimento sobre domínios específicos.
Alucinação: Ao usar dados incompletos ou desatualizados, os LLMs podem gerar respostas imprecisas.
O RAG aborda essas limitações adicionando uma etapa de recuperação, normalmente alimentada por pesquisa semântica, para obter documentos relevantes em tempo real. Fornecer contexto adicional ajuda os LLMs a gerar respostas mais precisas. Isso faz do RAG uma arquitetura eficaz para a criação de chatbots de IA que fornecem resposta personalizada e específica de domínio e geração de texto.
O que são bancos de dados vetoriais?
Os bancos de dados vetoriais são bancos de dados especializados, projetados para armazenar e recuperar com eficiência incorporações vetoriais. Embora o armazenamento de vetores na memória seja adequado para criação de protótipos e experimentação, os aplicativos de produção RAG normalmente exigem um banco de dados vetorial para realizar a recuperação eficiente de um corpus maior.
O MongoDB tem suporte nativo para armazenamento e recuperação de vetores, sendo uma opção conveniente para armazenar e pesquisar incorporações de vetor junto com seus outros dados. Para saber mais, consulte Visão geral da Vector Search do MongoDB .
Próximos passos
Para tutoriais adicionais, consulte os seguintes recursos:
Para saber como implementar o RAG com estruturas LLM populares e serviços de IA, consulte Integrações de IA do MongoDB .
Para criar agentes de IA e implementar RAG agente, consulte Criar agentes de IA com MongoDB.