Utiliser l’IA générative et MongoDB pour relever les plus grands défis de la cybersécurité

Mat Keep and Lena Smart
March 13, 2024 | Updated: March 10, 2026

Dans le paysage en constante évolution de la cybersécurité, les organisations sont confrontées à une multitude de défis qui exigent des solutions innovantes exploitant des technologies de pointe.

L’un des problèmes les plus urgents est la sophistication croissante des cybermenaces, notamment les malwares, les ransomwares et les attaques de phishing, qui sont de plus en plus difficiles à détecter et à atténuer. En outre, l’expansion rapide des infrastructures numériques a élargi la surface d’attaque, rendant la surveillance et la protection de chaque point d’entrée et de sortie toujours plus difficile pour les équipes de sécurité. Un autre défi de taille est la pénurie de professionnels de la cybersécurité compétents. Selon des études indépendantes, celle-ci est estimée à environ 4 millions de personnes dans le monde, rendant de nombreuses organisations vulnérables aux attaques.

Ces défis soulignent la nécessité de disposer de technologies de pointe capables de décupler les efforts humains pour sécuriser les actifs et les données numériques.

Comment l’IA générative peut-elle aider ?

L’IA générative est devenue un outil puissant pour répondre aux enjeux de la cybersécurité. En tirant parti des grands modèles de langage (LLM) pour générer de nouvelles données ou de nouveaux modèles basés sur des ensembles de données existants, l’IA générative peut fournir des solutions innovantes dans plusieurs domaines clés :

Détection des menaces et réponse améliorées

L’IA générative peut être utilisée pour créer des simulations de cybermenaces, y compris des malwares sophistiqués et des attaques de phishing. Ces simulations permettent d’entraîner des modèles de machine learning pour détecter plus précisément les menaces nouvelles et en évolution.

De plus, l’IA générative peut contribuer au développement de systèmes de réponse automatisés qui réagissent aux menaces en temps réel. Même si la supervision humaine sera toujours nécessaire, elle permet de réduire les interventions manuelles et les tâches répétitives, et ainsi de réagir plus rapidement aux attaques. Par exemple, avec une supervision appropriée, il est possible d’automatiser l’application de correctifs aux systèmes vulnérables ou d’ajuster les règles de firewall pour bloquer les vecteurs d’attaque. Cette capacité de réponse rapide et automatisée est particulièrement précieuse pour atténuer les vulnérabilités zero-day, où le délai entre la découverte d’une vulnérabilité et son exploitation par des pirates peut être très court.

Des enseignements exploitables tirés des analyses rétrospectives des événements de sécurité

Après un incident de cybersécurité, il est essentiel de procéder à une analyse rétrospective approfondie pour comprendre ce qui s’est passé, pourquoi cela s’est passé et comment éviter des événements semblables à l’avenir.

L’IA générative peut jouer un rôle central dans ce processus en synthétisant et en résumant des données complexes provenant d’une multitude de sources, notamment les journaux, le trafic réseau et les alertes de sécurité. En analysant ces données, l’IA générative permet d’identifier les modèles et les anomalies qui ont contribué à la faille de sécurité, offrant ainsi des informations qui pourraient être négligées par les analystes humains en raison du volume et de la complexité des données.

En outre, l’IA générative peut générer des rapports complets mettant en évidence les principales conclusions, les facteurs causals et les vulnérabilités potentielles, rationalisant ainsi le processus d’analyse a posteriori. Cette capacité accélère non seulement le processus de récupération et d’apprentissage, mais permet également aux organisations de mettre en œuvre des stratégies correctives plus efficaces, renforçant ainsi leur posture de cybersécurité.

Générer des données synthétiques pour l’entraînement de modèles d’apprentissage profond

Le manque de données réelles pour l’entraînement des systèmes de cybersécurité est un obstacle important. L’IA générative peut créer des ensembles de données synthétiques réalistes qui reflètent le véritable trafic réseau et le comportement des utilisateurs sans exposer d’informations sensibles.

Ces données synthétiques sont ensuite utilisées pour entraîner les systèmes de détection, améliorant ainsi leur précision et leur efficacité sans compromettre la protection de la vie privée ou la sécurité.

Automatiser la détection du phishing

Le phishing reste l’un des vecteurs d’attaque les plus courants. L’IA générative peut analyser les modèles présents dans les e-mails et les sites Web de phishing de façon à générer des modèles qui prédisent et détectent les tentatives de phishing avec une grande précision.

En intégrant ces modèles dans les applications de messagerie et les navigateurs Web, les organisations peuvent filtrer automatiquement les contenus de phishing, protégeant ainsi les utilisateurs des menaces potentielles.

En résumé : les opportunités et les risques

L’IA générative promet de transformer les pratiques de cybersécurité en automatisant les processus complexes, en améliorant la détection et la réponse aux menaces et en fournissant une meilleure compréhension des cybermenaces. Alors que l’IA générative fait son chemin dans les stratégies de cybersécurité, il est essentiel de rester vigilant quant à l’utilisation éthique de cette technologie et aux risques d’utilisation abusive.

Néanmoins, ses avantages en termes de renfort de la défense numérique sont indéniables, ce qui en fait un atout inestimable dans la lutte permanente contre les cybermenaces.

En quoi MongoDB est-il utile ?

Avec MongoDB, vos équipes de développement peuvent créer et déployer des cyberdéfenses en temps réel robustes, appropriées et différenciées plus rapidement, quelle que soit l’échelle.

Pour comprendre comment procède MongoDB, considérez que la pile technologique de l’IA se compose de trois couches :

Le calcul sous-jacent (les GPU) et les grands modèles de langage
Les outils de réglage des modèles, d’apprentissage en contexte et d’inférence par rapport aux modèles entraînés
Les applications d’IA et les expériences associées des utilisateurs finaux

MongoDB intervient au niveau de la deuxième couche de la pile. Il permet d’alimenter les LLM exécutés sur n’importe quelle infrastructure informatique avec les données propriétaires des clients afin de créer des applications de cybersécurité basées sur l’IA générative.

L’intégration de l’IA générative dans la cybersécurité permet ainsi à MongoDB de surmonter les problèmes les plus difficiles. MongoDB Atlas unifie les données opérationnelles, les données non structurées et les données vectorielles de manière sécurisée dans une plateforme multicloud unique et entièrement gérée. La copie et la synchronisation des données entre différents systèmes n’est donc plus nécessaire. L’architecture basée sur les documents de MongoDB permet également aux équipes de développement de modéliser facilement les relations entre les données de votre application et les représentations vectorielles continues. Cela permet de réaliser des analyses plus rapides et plus approfondies, et d’obtenir des informations précieuses sur les données de sécurité.

**Figure 1 :** MongoDB Atlas rassemble tous les services de données nécessaires pour créer des applications de cybersécurité modernes dans une API unifiée et une base de données moderne.

L’architecture ouverte de MongoDB est intégrée à un riche écosystème de frameworks de développement rassemblant IA, LLM et fournisseurs d’intégration. Combinée à nos capacités multicloud de pointe, cette solution offre à vos équipes de développement la flexibilité nécessaire pour agir rapidement et évite de dépendre d’un seul fournisseur de cloud ou technologie IA dans un environnement en évolution rapide.

Consultez notre page de ressources sur l'IA pour en savoir plus sur la création d'applications alimentées par l'IA avec MongoDB.

Intégrer l’IA générative et MongoDB dans les applications de cybersécurité en situation réelle

Renseignement sur les menaces

ExTrac utilise des analyses basées sur l’IA et MongoDB Atlas pour prédire les risques pour la sécurité publique en analysant des données provenant de milliers de sources. Conçue à l’origine pour aider les gouvernements occidentaux à prévoir les conflits, la plateforme s’étend désormais aux entreprises pour la gestion de leur réputation, entre autres.

Le modèle de données documentaire de MongoDB permet à ExTrac de gérer efficacement des données complexes, améliorant ainsi l’identification des menaces en temps réel. Atlas Vector Search aide à augmenter les modèles de langage et à gérer les représentations vectorielles continues pour les contenus texte, image et vidéo, accélérant ainsi le développement de caractéristiques. Cette approche permet à ExTrac de modéliser efficacement les tendances, de suivre l’évolution des narratifs et de prédire les risques pour ses clients, en tirant parti de la flexibilité et de la puissance de MongoDB pour gérer des données de tous formats et structures. Pour en savoir plus, consultez notre étude de cas ExTrac.

Évaluations de cybersécurité

VISO TRUST s’appuie sur l’IA pour rationaliser l’évaluation des risques cyber liés aux tiers, de façon à rendre les informations complexes sur la sécurité des fournisseurs rapidement accessibles et éclairer la prise de décision.

En utilisant Amazon Bedrock et MongoDB Atlas, la plateforme de VISO TRUST automatise la procédure de vérification de la sécurité des fournisseurs, réduisant de manière significative la charge de travail des équipes de sécurité. Son approche basée sur l’IA s’appuie sur un système de renseignements sur les artefacts qui classifie les documents de sécurité, détecte les organisations et prédit les emplacements de contrôle de sécurité dans les artefacts. MongoDB Atlas héberge des représentations vectorielles continues de texte alimentant un système de récupération dense qui améliore la précision des LLM grâce à la génération augmentée de récupération (RAG), fournissant des informations de sécurité instantanées et exploitables. Cette utilisation innovante de la technologie permet à VISO TRUST de proposer des évaluations rapides et évolutives des risques cyber, offrant ainsi à des entreprises comme InstaCart et Upwork des gains de productivité importants.

La base de données documentaire flexible de MongoDB et Atlas Vector Search jouent un rôle essentiel dans la gestion et l’interrogation de grandes quantités de données, soutenant la mission de VISO TRUST consistant à fournir des renseignements complets sur les risques cyber. Pour en savoir plus, consultez notre étude de cas Viso Trust.

Étapes pour commencer

L’IA générative alimentée par des LLM augmentés de vos propres données opérationnelles encodées sous forme de représentations vectorielles continues ouvre de nombreuses possibilités en matière de cybersécurité. Si vous souhaitez en savoir davantage sur la technologie et ses possibilités, consultez notre Learning Byte Atlas Vector Search. En seulement 10 minutes, vous aurez un aperçu des différents cas d’utilisation et découvrirez comment démarrer.

¹ Hill, M. (10 avril 2023). La pénurie de main-d’œuvre dans la cybersécurité avoisine les 4 millions malgré une importante campagne de recrutement. CSO.

← Previous

Mit generativer KI und MongoDB die größten Herausforderungen der Cybersicherheit in Angriff nehmen

In der sich ständig weiterentwickelnden Landschaft der Cybersicherheit sehen sich Unternehmen mit einer Vielzahl von Herausforderungen konfrontiert, die innovative Lösungen erfordern, die sich modernste Technologien zunutze machen. Eines der dringlichsten Probleme ist die zunehmende Raffinesse von Cyber-Bedrohungen, einschließlich Malware, Ransomware und Phishing-Angriffen, die immer schwieriger zu erkennen und abzuwehren sind. Darüber hinaus hat der schnelle Ausbau digitaler Infrastrukturen die Angriffsfläche vergrößert, sodass es für Sicherheitsteams schwieriger wird, jeden Ein- und Ausgangspunkt zu überwachen und zu schützen. Eine weitere große Herausforderung ist der Mangel an qualifizierten Fachkräften im Bereich der Cybersicherheit, der nach unabhängigen Erhebungen weltweit auf etwa 4 Millionen Mitarbeiter geschätzt wird1. Diese Herausforderungen unterstreichen den Bedarf an fortschrittlichen Technologien, die die menschlichen Bemühungen zur Sicherung digitaler Werte und Daten ergänzen können. Wie kann generative KI helfen? Die generative KI (GenAI) hat sich als ein leistungsfähiges Werkzeug zur Bewältigung dieser Cybersicherheitsherausforderungen erwiesen. Durch den Einsatz von Large Language Models (LLMs) zur Generierung neuer Daten oder Muster auf der Grundlage vorhandener Datensätze kann generative KI innovative Lösungen in mehreren Schlüsselbereichen bieten: Verbesserte Bedrohungserkennung und -reaktion Generative KI kann verwendet werden, um Simulationen von Cyber-Bedrohungen zu erstellen, einschließlich ausgefeilter Malware- und Phishing-Angriffe. Diese Simulationen können beim Training von Machine-Learning-Modellen helfen, um neue und sich entwickelnde Bedrohungen genauer zu erkennen. Darüber hinaus kann die generative KI bei der Entwicklung automatisierter Reaktionssysteme helfen, die in Echtzeit auf Bedrohungen reagieren. Dies wird zwar die menschliche Aufsicht nicht überflüssig machen, aber es wird den Bedarf an manuellen Eingriffen und Mühen verringern, sodass Angriffe schneller abgewehrt werden können. Mit der entsprechenden Aufsicht kann es zum Beispiel automatisch Patches auf anfällige Systeme anwenden oder Firewall-Regeln anpassen, um Angriffsvektoren zu blockieren. Diese automatisierte schnelle Reaktionsfähigkeit ist besonders wertvoll bei der Abwehr von Zero-Day-Schwachstellen, bei denen das Zeitfenster zwischen der Entdeckung einer Schwachstelle und ihrer Ausnutzung durch Angreifer sehr kurz sein kann. Umsetzbare Erkenntnisse aus den Postmortems von Sicherheitsereignissen Nach einem Cybersicherheitsvorfall ist eine gründliche Postmortem-Analyse entscheidend, um zu verstehen, was passiert ist, warum es passiert ist und wie ähnliche Vorfälle in Zukunft verhindert werden können. Generative KI kann in diesem Prozess eine entscheidende Rolle spielen, indem sie komplexe Daten aus einer Vielzahl von Quellen, einschließlich Protokollen, Netzwerkverkehr und Sicherheitswarnungen, synthetisiert und zusammenfasst. Durch die Analyse dieser Daten kann GenAI Muster und Anomalien erkennen, die zu dem Sicherheitsverstoß beigetragen haben könnten. Sie bietet Einblicke, die von menschlichen Analysten aufgrund der schieren Menge und Komplexität der Informationen möglicherweise übersehen werden. Darüber hinaus können umfassende Berichte erstellt werden, die die wichtigsten Ergebnisse, ursächlichen Faktoren und potenziellen Schwachstellen hervorheben und so den Postmortem-Prozess optimieren. Diese Fähigkeit beschleunigt nicht nur den Wiederherstellungs- und Lernprozess, sondern versetzt Unternehmen auch in die Lage, effektivere Abhilfestrategien zu implementieren und so letztendlich ihre Cybersicherheit zu stärken. Generierung synthetischer Daten für das Training von Deep Models Der Mangel an realen Daten für das Training von Cybersicherheitssystemen ist eine große Hürde. Die generative KI kann realistische, synthetische Datensätze erstellen, die den echten Netzwerkverkehr und das Nutzerverhalten widerspiegeln, ohne sensible Informationen preiszugeben. Diese synthetischen Daten können zum Trainieren von Erkennungssystemen verwendet werden, um deren Genauigkeit und Effektivität zu verbessern, ohne den Datenschutz oder die Sicherheit zu beeinträchtigen. Automatisierung der Phishing-Erkennung Phishing ist nach wie vor einer der häufigsten Angriffsvektoren. Gen AI kann Muster in Phishing-E-Mails und Websites analysieren und Modelle erstellen, die Phishing-Versuche mit hoher Genauigkeit vorhersagen und erkennen. Durch die Integration dieser Modelle in E-Mail-Systeme und Webbrowser können Unternehmen Phishing-Inhalte automatisch herausfiltern und Benutzer vor potenziellen Bedrohungen schützen. Alles zusammen: Die Chancen und die Risiken Generative KI verspricht, die Cybersicherheitspraktiken zu verändern, indem sie komplexe Prozesse automatisiert, die Erkennung von und Reaktion auf Bedrohungen verbessert und ein tieferes Verständnis von Cyberbedrohungen ermöglicht. Während die Branche die Integration von GenAI in ihre Cybersecurity-Strategien vorantreibt, ist es wichtig, den ethischen Einsatz dieser Technologie und das Missbrauchspotenzial im Auge zu behalten. Nichtsdestotrotz sind die Vorteile, die es bei der Stärkung der digitalen Verteidigung bietet, unbestreitbar und machen es zu einem unschätzbaren Vorteil im laufenden Kampf gegen Cyber-Bedrohungen. Wie kann MongoDB helfen? Mit MongoDB können Ihre Entwicklungsteams robuste, korrekte und differenzierte Echtzeit-Cyber-Abwehrsysteme schneller und in beliebigem Umfang erstellen und einsetzen. Um zu verstehen, wie MongoDB dies tut, sollten Sie sich vergegenwärtigen, dass der KI-Technologie-Stack aus drei Schichten besteht: Die zugrunde liegenden Berechnungen (GPUs) und LLMs Werkzeuge für die Feinabstimmung von Modellen zusammen mit Werkzeugen für kontextbezogenes Lernen und Inferenz gegen die trainierten Modelle Die KI-Anwendungen und die damit verbundenen Endbenutzererfahrungen MongoDB arbeitet auf der zweiten Ebene des Stacks. Es ermöglicht Kunden, ihre eigenen Daten in jedes LLM einzubringen, das auf jeder Computerinfrastruktur läuft, um KI-gestützte Cybersicherheitsanwendungen zu entwickeln. MongoDB löst die schwierigsten Probleme bei der Einführung von KI für die Cybersicherheit. MongoDB Atlas führt operative Daten, unstrukturierte Daten und Vektordaten sicher in einer einzigen, vollständig verwalteten Multi-Cloud-Plattform zusammen und vermeidet so die Notwendigkeit, Daten zwischen verschiedenen Systemen zu kopieren und zu synchronisieren. Die dokumentenbasierte Architektur von MongoDB ermöglicht es Entwicklungsteams außerdem, Beziehungen zwischen Ihren Anwendungsdaten und Vektoreinbettungen einfach zu modellieren. Dies ermöglicht tiefere und schnellere Analysen und Einblicke in sicherheitsrelevante Daten. Abbildung 1: MongoDB Atlas vereint alle Datendienste, die für den Aufbau moderner Cybersicherheitsanwendungen benötigt werden, in einer einheitlichen API und moderne Datenbank. Die offene Architektur von MongoDB ist in ein reichhaltiges Ökosystem von KI-Entwickler-Frameworks, LLMs und Einbettungsanbietern integriert. In Kombination mit unseren branchenführenden Multi-Cloud-Fähigkeiten gibt dies Ihren Entwicklungsteams die Flexibilität, sich schnell zu bewegen und sich nicht auf einen bestimmten Cloud-Anbieter oder eine KI-Technologie in diesem sich schnell entwickelnden Bereich festzulegen. Auf unserer KI-Ressourcenseite erfahren Sie mehr über die Entwicklung von KI-gestützten Apps mit MongoDB. Anwendung von GenAI und MongoDB auf reale Cybersicherheitsanwendungen Bedrohungsdaten ExTrac nutzt KI-gestützte Analysen und MongoDB Atlas, um Risiken für die öffentliche Sicherheit durch die Analyse von Daten aus Tausenden von Quellen vorherzusagen. Die Plattform half zunächst westlichen Regierungen bei der Vorhersage von Konflikten, wird aber nun auch auf Unternehmen ausgeweitet, u. a. für das Reputationsmanagement. Das Dokumentdatenmodell von MongoDB ermöglicht es ExTrac, komplexe Daten effizient zu verwalten und die Identifizierung von Bedrohungen in Echtzeit zu verbessern. Atlas Vector Search hilft bei der Erweiterung von Sprachmodellen und der Verwaltung von Vektoreinbettungen für Texte, Bilder und Videos und beschleunigt so die Entwicklung von Funktionen. Mit diesem Ansatz ist ExTrac in der Lage, Trends effizient zu modellieren, Entwicklungen zu verfolgen und Risiken für seine Kunden vorherzusagen. Dabei nutzt es die Flexibilität und Leistungsfähigkeit von MongoDB, um Daten jeglicher Form und Struktur zu verarbeiten. Erfahren Sie mehr in unserer ExTrac-Fallstudie . Cybersec-Bewertungen VISO TRUST nutzt KI, um die Bewertung von Cyber-Risiken Dritter zu optimieren und komplexe Sicherheitsinformationen von Anbietern für eine fundierte Entscheidungsfindung schnell zugänglich zu machen. Durch die Verwendung von Amazon Bedrock und MongoDB Atlas automatisiert die Plattform von VISO TRUST die Due-Diligence-Prüfung der Sicherheit von Anbietern und reduziert so die Arbeitsbelastung der Sicherheitsteams erheblich. Der KI-gestützte Ansatz umfasst eine Artefaktintelligenz, die Sicherheitsdokumente klassifiziert, Organisationen erkennt und die Position von Sicherheitskontrollen innerhalb von Artefakten vorhersagt. MongoDB Atlas enthält Texteinbettungen für ein dichtes Retrievalsystem, das die Genauigkeit von LLMs durch Retrieval-Augmented Generation (RAG) verbessert und sofortige, umsetzbare Sicherheitserkenntnisse liefert. Diese innovative Technologie ermöglicht es VISO TRUST, schnelle, skalierbare Bewertungen von Cyber-Risiken anzubieten, die für Unternehmen wie InstaCart und Upwork einen erheblichen Arbeits- und Zeitgewinn mit sich bringen. Die flexible Dokumentendatenbank von MongoDB und Atlas Vector Search spielen eine entscheidende Rolle bei der Verwaltung und Abfrage der riesigen Datenmengen und unterstützen die Mission von VISO TRUST, umfassende Informationen über Cyberrisiken zu liefern. Erfahren Sie mehr in unserer Fallstudie zu Viso Trust . Schritte für den Einstieg Generative KI auf der Grundlage von LLMs, ergänzt durch Ihre eigenen operativen Daten, die als Vektoreinbettungen kodiert sind, eröffnet viele neue Möglichkeiten für die Cybersicherheit. Wenn Sie mehr über die Technologie und ihre Möglichkeiten erfahren möchten, werfen Sie einen Blick auf unser Lernbyte zur Atlas Vector Search . In nur 10 Minuten erhalten Sie einen Überblick über die verschiedenen Anwendungsfälle und wie Sie loslegen können. 1 Hill, M. (2023, 10. April). Cybersecurity Arbeitskräftemangel erreicht 4 Millionen trotz erheblicher Einstellungsbemühungen. CSO.

March 13, 2024

Next →

10 Years of MongoDB Atlas: Built for What’s Next

Nearly a decade ago, I joined MongoDB as a Senior Product Manager to help build the company’s new cloud product, MongoDB Atlas. Our customers had been telling us they wanted to bring MongoDB’s familiar developer experience to the cloud, with the reliability and confidence teams needed to run in production. Atlas was our answer. Today, we’re celebrating 10 years of MongoDB Atlas, the generational data platform for AI applications, and the customers who pushed us to build it. Atlas was shaped in close conversation with those customers and scaled alongside them every step of the way. Today, more than 250,000 builders get started on Atlas every month. Atlas serves more than three trillion queries a day (a roughly threefold increase just since 2023!), and represents 75% of MongoDB’s revenue. Those numbers reflect something more important than growth: the trust builders and customers have placed in us to scale their businesses. That trust was earned by listening closely. Every major capability and architectural investment in Atlas was rooted in what customers asked for: the flexibility and speed of MongoDB’s document model, delivered in a platform that removed operational overhead and could scale with their applications. Over time, Atlas expanded beyond a managed database into a broader data platform, because builders kept asking for more flexibility, more simplicity, and more room to build. That matters even more in the AI era. AI applications create new demands, but the underlying requirement is familiar: builders need a platform that can support operational data, search, and retrieval while scaling through constant change—without forcing them to stitch together a mess of disconnected systems. We spent ten years becoming the flexible, durable data platform that builders trust. Those are the same qualities AI applications need most, and that’s why builders are now using Atlas to build trustworthy AI applications with highly accurate retrieval, real-time context, and the scale to run in production. Atlas 10 Year Anniversary Blog - Image 1 media Managed cloud databases become the default When Atlas launched in 2016, organizations were moving away from traditional data center build-outs and toward cloud-based delivery, a market Gartner forecasted would reach $204 billion (and is now approaching $1 trillion). Developers loved MongoDB as a flexible, intuitive foundation for building applications, but they also wanted to take advantage of the cloud. Atlas’s first promise was simple: bring MongoDB’s familiar developer experience to the cloud, with the reliability and confidence teams needed to run in production. Atlas 10 Year Anniversary Blog - Quote 1 aside To deliver that confidence to developer teams, we built Atlas with security, resilience, and performance at its core—from encryption and access controls to backups and high availability. The result was a service that teams could run in production with confidence, freeing developers to do their very best work without the headaches associated with database administration. By 2018, 81% of enterprises were operating in multi-cloud environments, and an IDG study found that more than half indicated they were thinking about cloud as a portfolio strategy. As customer architectures became more distributed, teams needed the flexibility to choose the cloud environment that fit their applications, teams, and compliance needs. To support them, we extended our original promise of simplicity into multi-cloud flexibility, with availability across all three major cloud providers. And in 2020, we introduced Atlas Multi-Cloud Clusters, making Atlas the first and only cloud database to let customers run applications simultaneously across AWS, Azure, and Google Cloud regions—a unique achievement that gave organizations that require ultra-high availability one consistent data foundation across all the major clouds. Today, customers can run across over 125 AWS, Google Cloud, and Microsoft Azure cloud regions, making Atlas the most widely available managed data platform in the world. Atlas 10 Year Anniversary Blog - Quote 2 aside Enterprises' scale, and consolidation becomes a customer priority As cloud adoption accelerated, customers wanted more than a hosted database. The cloud had become a long-term investment, and developers needed global reach, resilience, and a platform that could handle more workloads, securely, without requiring them to keep adding infrastructure around it. Because developers already trusted us on the fundamentals, Atlas could expand into the kinds of workloads enterprises could not afford to get wrong. For workloads like payments, inventory, and order processing, strong transactional consistency is a requirement. The addition of multi-document ACID transactions in 2018 brought that transactional consistency to MongoDB and marked an important step in MongoDB’s evolution, enabling MongoDB to serve the kinds of high-stakes transactional workloads that enterprises had historically reserved for relational databases. Now, customers could use MongoDB with greater confidence for a wider set of systems where accuracy, resilience, and trust could not be compromised. MongoDB extended its trustworthy database foundation with the launch of MongoDB Queryable Encryption, an industry-first encryption capability that allows customers to query encrypted data while keeping sensitive information protected when it is at rest, in transit, and in use—an important step for securing regulated and highly sensitive workloads. At the same time, Atlas continued to evolve to help customers operate at a larger scale. In 2020, we introduced Atlas Search and Online Archive, adding rich application search and giving customers a simpler, lower-cost way to store older data without losing easy access to it. In 2021, Native Time Series Collections and Live Resharding followed, helping customers manage time-stamped data more efficiently and scale architectures without downtime. These updates made Atlas easier for builders to work with as deployments became bigger, more distributed, and more complex, all while minimizing the number of disparate systems that development teams had to stitch together and maintain. Atlas 10 Year Anniversary Blog - Quote 3 aside Trustworthy AI becomes the new frontier Then, the launch of ChatGPT in late 2022—and with it the rise of generative AI—created a massive new challenge for builders. Enterprise adoption moved faster than standards and controls, leaving teams to figure out how to connect the necessary data components to run semantic search and retrieval-augmented generation (RAG) workloads together without creating a brittle mess of data pipelines, sync jobs, and specialized infrastructure that compromised security and performance. To help teams bring these critical AI building blocks together on one secure platform, Atlas evolved again. With the public release of Atlas Vector Search in 2023, MongoDB was one of the first databases to launch vector search as a native capability, which enabled developers to keep vectors close to operational data and run semantic retrieval directly in the database without having to manage a separate vector store. Search Nodes gave teams a way to scale search and vector workloads independently from the operational database, while Atlas Stream Processing gave builders a way to process real-time streaming data without adding separate infrastructure. The business demand for this architecture has been staggering: over 726,000 vector indexes and 55,000 vector applications have been created since we introduced Atlas Vector Search, and we’ve seen a 92% increase in customers showing production-level vector search usage over the past 12 months. And with the company’s acquisition of Voyage AI in 2025, MongoDB sharpened its focus on retrieval quality—bringing advanced embedding and reranking models into Atlas. The integration of Voyage AI was about rethinking the data architecture to help customers reduce hallucinations, improve relevance, and make AI useful in the real-world environments where accuracy and trust matter most. 10 Year Anniversary Blog - Quote 4 aside This immediately paid huge dividends for customers building highly accurate semantic search and RAG applications. But we knew that as the market moved towards autonomous AI, trustworthy retrieval and access to real-time context would matter even more. Agents and the future of the data layer Today, we’re firmly in AI’s agentic era. Builders want to deploy agents that can reason over business context with autonomy. But agent memory requires fast accuracy at scale so that the right information is recalled at precisely the right time. And this is where they run into a challenge. They're excited about agents, but they can't put an agent in front of their customers if the results are inconsistent, irrelevant, or flat-out wrong. That puts increasing focus on the data layer of the tech stack. Agents are only as good as the context they can retrieve, rank, and retain. If the underlying data is stale, incomplete, or poorly retrieved, the output will be wrong—regardless of how strong the model is. In practice, production agents depend less on model choice alone than on retrieval quality and the ability to ground responses in live operational data. With search, vector search, embeddings, and rerankers natively integrated into the Atlas platform, businesses are closing the gap between data and retrieval to produce fast, accurate results for agents at scale. And with foundational capabilities to ensure exceptional security, resilience, and performance, builders are freed up to do what they do best, instead of spending their days bogged down managing data infrastructure. Atlas 10 Year Anniversary Blog - Quote 5 aside Over the past decade, our goal has been to reduce operational burden for customers without compromising on the technical bar. As the industry moves toward agents, that aim still applies. We’re ten years in, and Atlas has grown into the data platform that runs intelligent, mission-critical applications for nearly 70,000 customers across every industry. The world runs on Atlas! Our customers pushed us to build everything that matters in the platform, so they could do more, faster. The same holds true today: the agentic AI era is raising the bar for innovation, and we're raising it with them. The ambition our customers bring to what they're building next is what drives us forward—and we're ready for it. Here's to the next 10 years.

June 25, 2026