Visão geral
Neste guia, você pode aprender como utilizar o recurso do Atlas Vector Search no driver Java . A Aggregates
classe de construtores vectorSearch()
do fornece o método assistente do que você pode utilizar para criar um estágio de pipeline $vectorSearch. Esse estágio do pipeline permite realizar uma pesquisa semântica em seus documentos. Uma pesquisa semântica é um tipo de pesquisa que localiza informações com significado semelhante, mas não necessariamente idênticas, ao termo ou frase de pesquisa fornecida.
Importante
Compatibilidade de recursos
Para saber quais versões do MongoDB Atlas suportam este recurso, consulte Limitações na documentação do MongoDB Atlas.
Realizar uma Vector Search
Para usar este recurso, você deve criar um índice de pesquisa de vetor e indexar suas incorporações de vetor. Para aprender a criar programaticamente um índice de pesquisa vetorial, consulte a seção java-search-indexes no guia de índices de pesquisa. Para aprender mais sobre incorporações de vetor, consulte Como Indexar Incorporações de Vetor para pesquisa vetorial na documentação do Atlas.
Depois de criar um índice de pesquisa vetorial nas incorporações vetoriais, você poderá fazer referência a esse índice no estágio do pipeline, conforme mostrado na seção a seguir.
Exemplo de Vector Search
O exemplo abaixo mostra como construir um aggregation pipeline que utiliza os métodos vectorSearch()
e project()
para calcular uma pontuação de pesquisa vetorial:
List<Double> queryVector = (asList(-0.0072121937, -0.030757688, -0.012945653)); String indexName = "mflix_movies_embedding_index"; FieldSearchPath fieldSearchPath = fieldPath("plot_embedding"); int numCandidates = 2; int limit = 1; VectorSearchOptions options = vectorSearchOptions().filter(gte("year", 2016)); List<Bson> pipeline = asList( vectorSearch( fieldSearchPath, queryVector, indexName, numCandidates, limit, options), project( metaVectorSearchScore("vectorSearchScore")));
Dica
Tipo de vetor de query
O exemplo anterior cria uma instância de BinaryVector
para servir como o vetor de consulta, mas você também pode criar um List
de Double
instâncias. No entanto, recomendamos que você use o tipo BinaryVector
para melhorar a eficiência do armazenamento.
O exemplo a seguir mostra como executar a agregação e imprimir a meta-score do vector search a partir do resultado da agregação pipeline anterior:
Document found = collection.aggregate(pipeline).first(); double score = found.getDouble("vectorSearchScore").doubleValue(); System.out.println("vectorSearch score: " + score);
Dica
Exemplos de Vector Search do driver Java
Visite a documentação do Atlas para encontrar mais tutoriais sobre como usar o driver Java para executar o Atlas Vector Search.
Documentação da API
Para saber mais sobre os métodos e tipos mencionados neste guia, consulte a documentação da API abaixo: