ATLAS
Vector Search
Créez des applications intelligentes alimentées par la recherche sémantique et l’IA générative sur n’importe quel type de données à l’aide d’une base de données vectorielle complète.
Qu'est-ce que Atlas Vector Search ?
Intégrez votre base de données opérationnelle et votre recherche vectorielle dans une plateforme sécurisée, unifiée et entièrement gérée dotée de fonctionnalités complètes de base de données vectorielle et de la polyvalence du document model. Stockez vos données opérationnelles, vos métadonnées et vos embeddings vectoriels sur Atlas tout en utilisant Atlas Vector Search pour créer des applications intelligentes basées sur l’IA générative.
Intégrations présentées
Principaux cas d'usage d'Atlas Vector Search
Atlas Vector Search vous permet d’interroger des données non structurées. Vous pouvez créer des embeddings vectoriels à l’aide de modèles de machine learning comme OpenAI et Hugging Face, puis les stocker et les indexer dans Atlas pour la génération augmentée de récupération (RAG), la recherche sémantique, les moteurs de recommandation, la personnalisation dynamique et autres cas d’utilisation.
Isolation des workloads pour plus d’évolutivité et de disponibilité
Mettez en place une infrastructure dédiée pour les workloads Atlas Search et Vector Search. Optimisez les ressources informatiques pour dimensionner la recherche et la base de données de manière indépendante afin d’obtenir de meilleures performances à l’échelle et une plus haute disponibilité.
La polyvalence d’Atlas en tant que base de données vectorielle
Plutôt que d’utiliser une base de données vectorielle autonome ou intégrée, la polyvalence de notre plateforme permet aux utilisateurs de stocker leurs données opérationnelles, leurs métadonnées et leurs embeddings vectoriels sur Atlas, et d’utiliser de manière fluide Atlas Vector Search pour indexer, récupérer et créer des applications d’IA générative performantes.
Supprimez le travail opérationnel
Atlas Vector Search s’appuie sur la plateforme de données pour les développeurs MongoDB Atlas. Automatisez facilement le provisionnement, l’application de correctifs, les mises à niveau, la mise à l’échelle, la sécurité et la reprise après sinistre, tout en offrant une visibilité approfondie des performances de la base de données et de Vector Search pour que vous puissiez vous concentrer sur la création d’applications.
Un solide écosystème d'intégrations de l'IA
Head of Content Digitalisation, Novo Nordisk
FAQ
Qu'est-ce que la recherche sémantique ?
La recherche sémantique consiste à rechercher la signification des données plutôt que les données elles-mêmes.
Qu'est-ce qu'un vecteur ?
Un vecteur est une représentation numérique des données et du contexte associé qui peut faire l'objet d'une recherche efficace à l'aide d'algorithmes avancés.
Quelle est la différence entre Atlas Vector Search et Atlas Search ?
Atlas Vector Search permet de rechercher des données en fonction de la signification sémantique capturée dans les vecteurs, tandis qu’Atlas Search permet de rechercher par mot clé, c’est-à-dire en fonction du texte lui-même et des correspondances de synonymes définis.
Puis-je utiliser MongoDB Atlas au lieu d’une base de données vectorielle autonome ?
Oui, MongoDB Atlas est une base de données vectorielle. Atlas est une plateforme de données de développement multicloud entièrement gérée, dotée d’un riche éventail de fonctionnalités, notamment la recherche textuelle, lexicale et vectorielle. Plutôt que d’utiliser une base de données vectorielle autonome ou intégrée, la polyvalence de notre plateforme permet aux utilisateurs de stocker leurs données opérationnelles, leurs métadonnées et leurs embeddings vectoriels sur Atlas, et d’utiliser de manière fluide Atlas Vector Search pour indexer, récupérer et créer des applications d’IA générative performantes.
Quelles sont les différences entre la recherche des k plus proches voisins (KNN), la recherche approximative du plus proche voisin (ANN) et la recherche exacte du plus proche voisin (ENN) ?
L’approche KNN, ou K plus proches voisins, est l’algorithme fréquemment utilisé pour trouver des vecteurs proches les uns des autres.
La recherche approximative des plus proches voisins (ANN, Approximate Nearest Neighbors) est une approche de recherche de vecteurs similaires qui privilégie la performance à la précision. Il s’agit de l’un des principaux algorithmes utilisés pour l’exécution de MongoDB Atlas Vector Search. Notre algorithme de recherche approximative du plus proche voisin utilise le graphique Hierarchical Navigable Small World (HNSW) pour l’indexation et l’interrogation efficaces de millions de vecteurs.
La recherche des plus proches voisins exacts (ENN, Exact Nearest Neighbors) est une approche de recherche de vecteurs similaires qui privilégie la précision au détriment de certaines performances. Cette méthode renvoie les vecteurs exacts les plus proches d’un vecteur de requête, le nombre de vecteurs étant spécifié par la variable limit. L’exécution d’une requête de recherche vectorielle exacte peut assurer une latence inférieure à la seconde pour des requêtes non filtrées jusqu’à 10 000 documents. Elle peut également fournir des réponses à faible latence pour des filtres très sélectifs qui réduisent un large ensemble de documents à 10 000 documents ou moins, classés par pertinence vectorielle.
Qu'est-ce que $vectorSearch et en quoi cela diffère-t-il de l'opérateur knnBeta dans $search ?
$vectorSearch est une étape d’agrégation dans MongoDB Atlas qui vous permet d’exécuter une requête de recherche approximative du plus proche voisin (ANN) ou une recherche exacte du plus proche voisin (ENN) à l’aide du filtrage MongoDB Query API (par exemple, "$eq" ou "$gte"). Cette étape sera prise en charge sur les clusters Atlas à partir de la version 6.0. Le type de champ knnVector et l’opérateur knnBeta d’Atlas Search dans $search sont désormais obsolètes.
Que sont les nœuds de recherche ?
Les nœuds de recherche fournissent une infrastructure dédiée aux workloads Atlas Search et Vector Search, ce qui vous permet d’optimiser les ressources de calcul et de répartir les besoins de recherche indépendamment de la base de données. Les nœuds de recherche offrent de meilleures performances à l’échelle grâce à l’isolation des workloads, une meilleure disponibilité et la possibilité de mieux optimiser l’utilisation des ressources.
Quels embeddings vectoriels Atlas Vector Search prend-il en charge ? Qu’en est-il de la quantification vectorielle ?
Atlas Vector Search supporte les intégrations de n’importe quel fournisseur en dessous de la limite de dimension de 4 096 sur le service. Nous prenons actuellement en charge l’ingestion, l’indexation et l’interrogation des embeddings vectoriels quantifiés scalaires du fournisseur de votre choix. Nous ajouterons prochainement la prise en charge de l’ingestion de vecteurs quantifiés binaires ainsi que la quantification scalaire et binaire automatique avec rescoring dans Atlas, permettant des économies de coûts et de stockage sans compromettre la précision.
La recherche vectorielle fonctionne-t-elle avec des images, des fichiers multimédias et d'autres types de données ?
Oui, Atlas Vector Search peut requêter n'importe quel type de données pouvant être transformées en embedding. L'un des avantages du modèle documentaire est que vous pouvez stocker vos embeddings à côté de vos données riches dans vos documents.