ATLAS
Vector Search
Créez des applications intelligentes alimentées par la recherche sémantique et l'IA générative en utilisant les capacités natives complètes des bases de données vectorielles.
Qu'est-ce que la recherche vectorielle ?
L'IA générative utilise des vecteurs pour activer une recherche sémantique intelligente sur des données non structurées (texte, images et audio). Les vecteurs sont cruciaux pour la création de moteurs de recommandation, la détection d'anomalies et l'IA conversationnelle. Le large éventail de cas d'utilisation, rendu possible par les capacités natives de MongoDB, offre des expériences utilisateur transformatrices.
La puissance combinée des vecteurs et de MongoDB
Une simplicité inégalée
Évitez la taxe de synchronisation. Avec Atlas Vector Search intégré à la base de données principale, il n'est pas nécessaire de synchroniser les données entre vos bases de données opérationnelles et vectorielles, ce qui permet de gagner du temps, de réduire la complexité et d'éviter les erreurs. Vos données opérationnelles et vectorielles restent en un seul endroit.
Capacités de requête puissantes
Combinez facilement des requêtes vectorielles avec des filtres sur les métadonnées, des recherches dans les graphiques, des pipelines d'agrégation, des recherches géospatiales et des recherches lexicales pour des cas d'utilisation de recherche hybride puissants au sein d'une seule base de données.
Mise à l'échelle supérieure pour les applications de recherche vectorielle
Contrairement à d'autres solutions, l'architecture distribuée de MongoDB permet de faire évoluer la recherche vectorielle indépendamment de la base de données principale. Cela permet une véritable isolation des charges de travail et une optimisation des requêtes vectorielles, ce qui se traduit par des performances supérieures à grande échelle.
Base de données vectorielle prête à l'emploi
La sécurité et la haute disponibilité sont intégrées. Étant donné que les données vectorielles sont stockées directement dans Atlas avec vos données opérationnelles, vous pouvez être assuré que vos charges de travail fonctionnent avec la même fiabilité, sécurité et disponibilité de niveau entreprise pour lesquelles MongoDB est réputé.

Head of Content Digitalisation, Novo Nordisk

Head of Content Digitalisation, Novo Nordisk
Directeur de l’ingénierie, Okta
Senior Data Scientist, Delivery Hero

CEO, Kovai

Ingénieur logiciel senior de VISO TRUST

Centre d’apprentissage
FAQ
Atlas Vector Search permet de rechercher des données sur la base du sens sémantique capturé dans les vecteurs, tandis qu'Atlas Search permet la recherche par mot-clé, c'est-à-dire, sur la base du texte lui-même et de toute correspondance synonymique définie.
Oui, MongoDB Atlas est une base de données vectorielle. Atlas est une plateforme de données de développement multicloud entièrement gérée, dotée d’un riche éventail de fonctionnalités, notamment la recherche textuelle, lexicale et vectorielle. Plutôt que d’utiliser une base de données vectorielle autonome ou intégrée, la polyvalence de notre plateforme permet aux utilisateurs de stocker leurs données opérationnelles, leurs métadonnées et leurs intégrations vectorielles sur Atlas, et d’utiliser de manière fluide Atlas Vector Search pour indexer, récupérer et créer des applications d’IA générative performantes.
KNN signifie « K-Nearest Neighbors » ([recherche des] k plus proches voisins), un algorithme fréquemment utilisé pour trouver des vecteurs proches les uns des autres.
ANN signifie « Approximate Nearest Neighbors » ([recherche] approximative des plus proches voisins) et constitue une approche pour trouver des vecteurs similaires qui privilégient la performance au détriment de la précision. Il s'agit de l'un des algorithmes de base utilisés pour alimenter Atlas Vector Search. Notre algorithme de recherche approximative des plus proches voisins utilise le graphique HNSW (Hierarchical Navigable Small World) pour une indexation et une interrogation efficaces de millions de vecteurs.
ENN signifie « Exact Nearest Neighbors » ([recherche] exacte des plus proches voisins) et il s'agit d'une approche pour trouver des vecteurs similaires qui peut privilégier la précision au détriment de la performance. Cette méthode renvoie les vecteurs exacts les plus proches d'un vecteur de requête, avec le nombre de vecteurs spécifié par la variable limite. L'exécution d'une requête de recherche exacte des plus proches voisins (ENN) peut assurer une latence inférieure à la seconde pour des requêtes non filtrées jusqu'à 10 000 documents. Elle peut également fournir des réponses à faible latence pour des filtres très sélectifs qui limitent un large ensemble de documents à 10 000 unités ou moins, classées par pertinence vectorielle.
$vectorSearch est une étape d’agrégation dans MongoDB Atlas qui vous permet d’exécuter une requête de recherche approximative du plus proche voisin (ANN) ou une recherche exacte du plus proche voisin (ENN) à l’aide du filtrage MongoDB Query API (par exemple, "$eq" ou "$gte"). Cette étape est prise en charge sur les clusters Atlas à partir de la version 6.0. Le type de champ knnVector et l’opérateur knnBeta d’Atlas Search dans $search sont désormais obsolètes.
Atlas Vector Search prend en charge les intégrations de n’importe quel fournisseur qui se trouve sous la limite de dimension de 4 096 sur le service.
Nous prenons en charge l’ingestion, l’indexation et l’interrogation de vecteurs quantifiés scalaires et binaires à partir de fournisseurs d'intégrations. Nous offrons également la possibilité de mettre en place la quantification scalaire et binaire automatique des vecteurs haute fidélité dans Atlas Vector Search.
Oui, Atlas Vector Search peut effectuer une requête sur n'importe quel type de données pouvant être transformées en intégration de vecteur. L'un des avantages du modèle documentaire est que vous pouvez stocker vos intégrations directement à côté de vos données riches dans vos documents.
Premiers pas avec Atlas Vector Search
- Déploiement simplifié
- Expérience unifiée pour les développeurs
- Scalabilité horizontale, verticale, indépendante
- Écosystème d’IA intégré
- Plus de 125 régions dans le monde