Présentation d'Atlas Vector Search : construire des applications intelligentes avec la recherche sémantique et l'IA sur n'importe quel type de données

Benjamin Flast

Nous sommes ravis d'annoncer qu'Atlas Vector Search est désormais disponible. Vector Search prend désormais en charge les charges de travail de production. Vous pouvez ainsi continuer à créer des applications intelligentes alimentées par la recherche sémantique et l'IA générative, tout en optimisant la consommation des ressources et en améliorant les performances avec les nœuds de recherche.

Lisez cet article pour connaître tous les avantages.

Le moment est enfin venu. L'intelligence artificielle est là. Ce qui était autrefois construit et souvent piégé au sein des équipes de data science et d'apprentissage automatique au niveau de l'entreprise est désormais facilement accessible aux constructeurs du monde entier. Mais pour exploiter l'incroyable puissance de ces nouveaux outils, vous devez vous appuyer sur une plateforme de données fiable, modulable et élégante. En même temps, comme nous l'avons tous vu, ces nouvelles capacités ne sont valables que dans la mesure où elles ont accès aux données ou à la "vérité de terrain". C'est pourquoi nous sommes ravis d'ajouter une nouvelle fonctionnalité sur MongoDB Atlas, notre Developer Data Platform, pour libérer tout le potentiel de vos données et alimenter les applications d'IA. Aujourd'hui, MongoDB a le plaisir d'annoncer sa nouvelle fonctionnalité de Vector Search, conçue pour répondre aux exigences des données sous toutes leurs formes et permettre à nos partenaires d'exploiter ces nouvelles capacités incroyables.

Consultez notre page de ressources sur l'IA pour en savoir plus sur la création d'applications alimentées par l'IA avec MongoDB.


En quoi consiste cette fonctionnalité ?

Pour ceux qui ne connaissent pas, la recherche vectorielle est une capacité qui vous permet de requêter vos données sur la base de la sémantique ou de la signification des données plutôt que sur les données elles-mêmes. Cela est possible grâce à la représentation numérique de toute forme de données sous la forme d'un vecteur, qui peuvent ensuite être comparées les unes aux autres au moyen d'algorithmes sophistiqués. La première étape consiste à prendre les données sources - texte, audio, image ou vidéo - et à les convertir en « vecteurs » ou « encastrements » à l'aide d'un « modèle d'encodage ». Grâce aux progrès récents de l'intelligence artificielle, ces vecteurs sont désormais mieux à même de saisir la signification des données en projetant des données de faible dimension dans un espace de dimension supérieure qui contient davantage de contexte sur les données. Une fois que ces données ont été transformées en représentations numériques, vous pouvez les interroger pour trouver des valeurs similaires à l'aide d'un algorithme approximatif des voisins les plus proches qui permet à vos requêtes de trouver très rapidement des données avec vecteurs similaires. Cela vous permet de répondre à des requêtes telles que « Donnez-moi des films tristes » ou « Donnez-moi des images qui ressemblent à… ».Cette fonctionnalité ouvre la voie à de nouvelles possibilités.

Quel est le lien avec notre plateforme ?

Grâce à cette fonctionnalité intégrée à MongoDB Atlas, vous n'avez pas besoin de copier et de transformer vos données, d'apprendre une nouvelle technologie et une nouvelle syntaxe, ou de devoir gérer toute une nouvelle infrastructure. Avec Atlas Vector Search de MongoDB, vous pouvez utiliser ces nouvelles capacités puissantes au sein d'une plateforme de classe mondiale et éprouvée pour créer des applications plus rapidement. La plupart des défis inhérents à l'exploitation de l'IA et de la recherche vectorielle découlent de la complexité liée à l'exposition en toute sécurité des données de l'application. Ces tâches ajoutent des couches de friction à l'expérience du développeur et rendent vos applications plus difficiles à construire, à déboguer et à maintenir. MongoDB relève ces défis tout en apportant la puissance de la recherche vectorielle à une plateforme qui répartit organiquement verticalement et horizontalement pour supporter toutes les charges de travail que vous lui confiez. Enfin, tout cela n'a pas d'importance sans garanties en matière de sécurité et de disponibilité, et l'engagement de MongoDB en faveur d'une solution de gestion des données sécurisée, ainsi que la haute disponibilité grâce à la redondance et au basculement automatique, garantissent que votre application ne perdra jamais de temps.

Nouveau chez MongoDB.local London

Depuis .Local London, nous sommes ravis d'annoncer l'introduction d'une étape d'agrégation dédiée à la recherche vectorielle qui peut être invoquée via $vectorSearch. Cette nouvelle étape introduit de nouveaux concepts qui renforcent la puissance et facilitent plus que jamais l'utilisation de la recherche vectorielle. Avec $vectorSearch, vous pouvez également utiliser un préfiltre avec la syntaxe MQL (par exemple, $gte, $eq, etc.) qui filtre les documents au fur et à mesure que vous parcourez l'index. Vous obtenez ainsi des résultats cohérents et des performances élevées. Les développeurs qui maîtrisent MongoDB pourront pleinement exploiter cette capacité de filtrage ! Enfin, nous introduisons également deux façons d'ajuster vos résultats au sein de l'étape d'agrégation, les paramètres « numCandidates » et « limit ». Ils vous permettent d'ajuster le nombre de documents qui devraient être candidats pour la recherche approximative du plus proche voisin, puis limiter le nombre de résultats que vous souhaitez obtenir avec le paramètre « limit ».

Comment interagit-il avec l'écosystème ?

Le nombre d'innovations dans le secteur de l’intelligence artificielle est stupéfiant, et il est étonnant de voir les progrès rapidement réalisés par la communauté open source. Des progrès considérables ont été réalisés dans les modèles de langage open source ainsi que dans les différentes méthodes d'intégration aux applications. Avec la puissance brute exposée par l'intelligence artificielle, disposer d'une abstraction solide sur la capacité à donner aux développeurs la flexibilité dont ils ont besoin est plus que jamais essentiel. C'est pourquoi nous sommes ravis de vous annoncer que plusieurs fonctionnalités sont prises en charge dans LangChain et LlamaIndex, de la recherche vectorielle à l'enregistrement des conversations en passant par l'indexation des documents. Nous avançons rapidement et nous continuerons à développer de nouvelles fonctionnalités pour les principaux fournisseurs.

Conclusion

Ce n'est que le début. Chez MongoDB, nous nous engageons à aider les développeurs à créer la prochaine génération d'applications basées sur l'IA grâce à la meilleure plateforme de données pour développeurs du marché. Nous allons également nous pencher sur d'autres modèles d'architectures et plugins que nous pouvons soutenir. Mais comme toujours, la partie la plus importante de cette équation, c'est vous, le développeur. Nous allons discuter avec la communauté et trouver les moyens de vous servir au mieux et de nous assurer que nous répondons à vos besoins à chaque étape du processus. Place à la création !

Pour en savoir plus sur Atlas Vector Search et savoir s'il s'agit de la bonne solution pour vous, consultez notre documentation, notre livre blanc et nos tutoriels ou commencez dès aujourd'hui.