Geração Aumentada de Recuperação (RAG) com Voyage IA

A API de incorporação e reclassificação está na visualização. O recurso e a documentação correspondente podem mudar a qualquer momento durante o período de pré-visualização.

A geração aumentada de recuperação (RAG) é uma arquitetura que usa a pesquisa semântica para aumentar os grandes modelos de linguagem (LLMs) com dados adicionais, permitindo que gerem respostas mais precisas.

Enquanto a pesquisa semântica recupera documentos relevantes com base no significado, o RAG leva isso um passo além, fornecendo esses documentos recuperados como contexto para um LLM. Esse contexto adicional ajuda o LLM a gerar uma resposta mais precisa à consulta de um usuário, reduzindo as atordoamentos. A Voyage IA fornece os melhores modelos de incorporação e reclassificação da classe para a recuperação de energia para seus aplicativos RAG.

Para experimentar o RAG sem escrever nenhum código, use o Playground para criar um chatbot de IA com a tecnologia Voyage AI. Para aprender mais, consulte Construtor de demonstração do chatbot.

clique para ampliar

Tutorial

O tutorial a seguir demonstra como implementar o RAG com incorporações do Voyage.

Você também pode trabalhar com o código deste tutorial clonando o repositório do GitHub.

Linguagem

Provedor de LLM

Vector armazenamento

Por que usar a RAG?

Ao usar LLMs, você pode encontrar as seguintes limitações:

Dados obsoletos: os LLMs são formados em um conjunto de dados estático até um determinado ponto no tempo. Isso significa que eles têm uma base de conhecimento limitada e podem usar dados desatualizados.
Sem acesso a dados adicionais: os LLMs não têm acesso a dados locais, personalizados ou específicos do domínio. Portanto, eles podem não ter conhecimento sobre domínios específicos.
Alucinação: Ao usar dados incompletos ou desatualizados, os LLMs podem gerar respostas imprecisas.

O RAG aborda essas limitações adicionando uma etapa de recuperação, normalmente alimentada por pesquisa semântica, para obter documentos relevantes em tempo real. Fornecer contexto adicional ajuda os LLMs a gerar respostas mais precisas. Isso faz do RAG uma arquitetura eficaz para a criação de chatbots de IA que fornecem resposta personalizada e específica de domínio e geração de texto.

O que são bancos de dados vetoriais?

Os bancos de dados vetoriais são bancos de dados especializados, projetados para armazenar e recuperar com eficiência incorporações vetoriais. Embora o armazenamento de vetores na memória seja adequado para criação de protótipos e experimentação, os aplicativos de produção RAG normalmente exigem um banco de dados vetorial para realizar a recuperação eficiente de um corpus maior.

O MongoDB tem suporte nativo para armazenamento e recuperação de vetores, sendo uma opção conveniente para armazenar e pesquisar incorporações de vetor junto com seus outros dados. Para saber mais, consulte Visão geral do MongoDB Vector Search.

Próximos passos

Para tutoriais adicionais, consulte os seguintes recursos:

Para aprender como implementar o RAG com frameworks LLM populares e serviços de IA, consulte Integrações de IA do MongoDB.
Para criar agentes de IA e implementar RAG agente, consulte Criar agentes de IA com MongoDB.

Voltar

Pesquisa semântica

Tokenização