Menu Docs
Página inicial do Docs
/

Geração Aumentada de Recuperação (RAG) com Voyage AI

A geração aumentada por recuperação (RAG) é uma arquitetura que usa a pesquisa semântica para aumentar os modelos de linguagem grandes (LLMs) com dados adicionais, permitindo que gerem respostas mais precisas.

Enquanto a pesquisa semântica recupera documentos relevantes com base no significado, o RAG leva isso um passo além, fornecendo esses documentos recuperados como contexto para um LLM. Esse contexto adicional ajuda o LLM a gerar uma resposta mais precisa à consulta de um usuário, reduzindo as atordoamentos. A Voyage AI fornece os melhores modelos de incorporação e reclassificação da classe para a recuperação de energia para seus aplicativos RAG.

Para experimentar o RAG sem escrever nenhum código, use o Playground para criar um chatbot de IA com a tecnologia Voyage AI. Para saber mais, consulte Construtor de demonstração do chatbot.

Diagrama da arquitetura RAG
clique para ampliar

O tutorial a seguir demonstra como implementar o RAG com incorporações do Voyage.

Ao usar LLMs, você pode encontrar as seguintes limitações:

  • Dados obsoletos: os LLMs são formados em um conjunto de dados estático até um determinado ponto no tempo. Isso significa que eles têm uma base de conhecimento limitada e podem usar dados desatualizados.

  • Sem acesso a dados adicionais: os LLMs não têm acesso a dados locais, personalizados ou específicos do domínio. Portanto, eles podem não ter conhecimento sobre domínios específicos.

  • Alucinação: Ao usar dados incompletos ou desatualizados, os LLMs podem gerar respostas imprecisas.

O RAG aborda essas limitações adicionando uma etapa de recuperação, normalmente alimentada por pesquisa semântica, para obter documentos relevantes em tempo real. Fornecer contexto adicional ajuda os LLMs a gerar respostas mais precisas. Isso faz do RAG uma arquitetura eficaz para a criação de chatbots de IA que fornecem resposta personalizada e específica de domínio e geração de texto.

Os bancos de dados vetoriais são bancos de dados especializados, projetados para armazenar e recuperar com eficiência incorporações vetoriais. Embora o armazenamento de vetores na memória seja adequado para criação de protótipos e experimentação, os aplicativos de produção RAG normalmente exigem um banco de dados vetorial para realizar a recuperação eficiente de um corpus maior.

O MongoDB tem suporte nativo para armazenamento e recuperação de vetores, sendo uma opção conveniente para armazenar e pesquisar incorporações de vetor junto com seus outros dados. Para saber mais, consulte Visão geral da Vector Search do MongoDB .

Para tutoriais adicionais, consulte os seguintes recursos:

Voltar

Pesquisa semântica

Nesta página