AnkündigungWir stellen MongoDB 8.0 vor, das schnellste MongoDB aller Zeiten! Mehr erfahren >
AnkündigungVoyage AI und MongoDB unterstützen ab sofort gemeinsam genauere und vertrauenswürdigere KI-Anwendungen auf Atlas. Mehr erfahren >

Connectors

MongoDB Connector for Apache Spark

Unser Konnektor verknüpft Apache Spark, die branchenführende Engine für die Datenverarbeitung, mit MongoDB, der am schnellsten wachsenden Datenbank der Branche. So können Sie die Vorteile beider Technologien nutzen, um innovative, ausgefeilte Tools für Echtzeitanalysen zu erstellen. MongoDB Connector for Apache Spark ist heute allgemein verfügbar, zertifiziert und wird für den Produktionseinsatz unterstützt.
Jetzt herunterladen

Schnell relevante Erkenntnisse gewinnen

Wir leben in einer Welt, in der sich alles um „Big Data“ dreht. Dabei liegt der Mehrwert nicht nur in den Daten selbst, sondern vor allem in den Erkenntnissen, die sich aus diesen Daten gewinnen lassen. Unternehmen mit der Fähigkeit, die in ihren Daten enthaltenen Erkenntnisse schnell nutzbar zu machen, haben einen wichtigen Wettbewerbsvorteil. Allerdings genügt es mittlerweile nicht mehr, die Daten in den geschäftlich genutzten Systemen zu sammeln und dann Nacht für Nacht mithilfe von ETL-Prozessen in das unternehmenseigene Data Warehouse zu kopieren.

Eine Illustration eines steigenden Balkendiagramms und eines Raketenschiffs
Ein Diagramm zur Darstellung der Analyseanwendung, die durch den Apache Spark Connector ermöglicht wird

Erschließen Sie das Potenzial von Apache Spark

Der MongoDB Connector for Apache Spark unterstützt alle Spark-Bibliotheken, einschließlich Scala, Java, Python und R. Er stellt MongoDB-Daten in Form von DataFrames und Datasets für Analyseprozesse bereit, bei denen maschinelles Lernen, Graphen, Streaming und SQL-APIs zur Anwendung kommen.

Nutzen Sie die Vorteile von MongoDB

Der MongoDB Connector for Apache Spark kann die Aggregationspipeline und die umfangreichen Sekundärindizes von MongoDB nutzen, um nur die benötigten Daten zu extrahieren, zu filtern und zu verarbeiten – beispielsweise um alle Kunden in einer bestimmten Region zu analysieren. Traditionelle NoSQL-Datenspeicher bieten keine Sekundärindizes oder datenbankinterne Aggregationen. In diesen Fällen müsste Spark alle Daten basierend auf einem einfachen Primärschlüssel extrahieren, auch wenn nur eine Teilmenge dieser Daten für den Spark-Prozess erforderlich ist. Der MongoDB Connector for Apache Spark legt Resilient Distributed Datasets (RDDs) mit dem MongoDB-Quellknoten zusammen, um die Datenbewegung im Cluster zu minimieren und die Latenz zu verringern.
Eine Illustration einer Aggregationspipeline mit Datenfluss

MongoDB und Apache Spark: die ideale Kombination für Datenexperten

Obwohl MongoDB von Haus aus leistungsstarke Funktionen für Echtzeitanalysen bietet, gibt es Anwendungsfälle, in denen die Verarbeitung der von MongoDB verwalteten Daten mit der Apache-Spark-Engine beschleunigt werden kann. Durch die gemeinsame Nutzung beider Lösungen können Anwender die von Spark gelieferten Analyseergebnisse in Echtzeit in ihre Geschäftsprozessen in MongoDB einfließen lassen.
industry_airline_app

China Eastern Airlines

Als eine der weltweit größten Fluggesellschaften erforscht China Eastern ständig neue Technologien, um neue Wege zur Verbesserung der Kundenerfahrung und zur Kostensenkung zu finden. China Eastern Airlines nutzt MongoDB Connector for Apache Spark für seine Engine zur Flugpreisberechnung. Damit werden täglich 1,6 Milliarden Abfragen bearbeitet.
Mehr erfahren
industry_finance

Qumram

Qumram: Die in MongoDB gespeicherten Benutzersitzungsdaten werden den maschinellen Lernprozessen von Spark zur Verfügung gestellt, um globale Finanzinstitutionen bei der Erkennung von Betrug durch Verhaltensanalysen zu unterstützen und Deep-Learning-Techniken für die Stimmungsanalyse mit Natural Language Processing (NLP) anzuwenden.
Mehr erfahren
cloud_iot

Stratio

Das Unternehmen Stratio hat seine Big Data-Plattform auf Pure Spark implementiert, die MongoDB mit Apache Spark, Zeppelin und Kafka kombiniert, um einen operativen Data Lake für Mutua Madrileña, eine der größten Versicherungsgesellschaften Spaniens, aufzubauen. Machine-Learning-Modelle wurden entwickelt, um das Kundenerlebnis zu personalisieren, mithilfe einer Analyse von Marketingkampagnen-Daten die Auswirkungen zu messen und die Leistung zu verbessern.

Mehr erfahren
industry_airline_app

Globale Fluggesellschaft

Eine global agierende Fluggesellschaft konsolidiert Kundendaten, die auf mehr als 100 Systeme verteilt sind, in eine einheitliche MongoDB-Sicht. Während der Kunde das Online-Angebot des Unternehmens nutzt oder mit einem Callcenter-Mitarbeiter spricht, werden die von MongoDB verwalteten Kundendaten mithilfe von Spark-Prozessen analysiert. So können Kunden in Echtzeit eingestuft und mit personalisierten Angeboten versorgt werden.

Nächste Schritte

general_action_download

Herunterladen

Sie können MongoDB Spark Connector von GitHub herunterladen.

Jetzt herunterladen
general_content_learn

Schulungsmaterial

Lesen Sie unser neues Whitepaper: Von der Echtzeitanalyse zur Echtzeitreaktion mit Apache Spark und MongoDB (nur in englischer Sprache verfügbar).

Mehr erfahren
general_action_audit

Durchsuchen

Durchsuchen Sie die Dokumentation zum MongoDB Spark Connector in unserer Docs-Bibliothek.

Dokumente anzeigen

Sind Sie bereit, einzusteigen?

Holen Sie sich MongoDB-Connector for Apache Spark.
Jetzt testenKontakt zum Vertrieb
Database illustration