Connectors
MongoDB Connector for Apache Spark
Schnell relevante Erkenntnisse gewinnen
Wir leben in einer Welt, in der sich alles um „Big Data“ dreht. Dabei liegt der Mehrwert nicht nur in den Daten selbst, sondern vor allem in den Erkenntnissen, die sich aus diesen Daten gewinnen lassen. Unternehmen mit der Fähigkeit, die in ihren Daten enthaltenen Erkenntnisse schnell nutzbar zu machen, haben einen wichtigen Wettbewerbsvorteil. Allerdings genügt es mittlerweile nicht mehr, die Daten in den geschäftlich genutzten Systemen zu sammeln und dann Nacht für Nacht mithilfe von ETL-Prozessen in das unternehmenseigene Data Warehouse zu kopieren.
Erschließen Sie das Potenzial von Apache Spark
Der MongoDB Connector for Apache Spark unterstützt alle Spark-Bibliotheken, einschließlich Scala, Java, Python und R. Er stellt MongoDB-Daten in Form von DataFrames und Datasets für Analyseprozesse bereit, bei denen maschinelles Lernen, Graphen, Streaming und SQL-APIs zur Anwendung kommen.
Nutzen Sie die Vorteile von MongoDB
Der MongoDB Connector for Apache Spark kann die Aggregationspipeline und die umfangreichen Sekundärindizes von MongoDB nutzen, um nur die benötigten Daten zu extrahieren, zu filtern und zu verarbeiten – beispielsweise um alle Kunden in einer bestimmten Region zu analysieren. Traditionelle NoSQL-Datenspeicher bieten keine Sekundärindizes oder datenbankinterne Aggregationen. In diesen Fällen müsste Spark alle Daten basierend auf einem einfachen Primärschlüssel extrahieren, auch wenn nur eine Teilmenge dieser Daten für den Spark-Prozess erforderlich ist. Der MongoDB Connector for Apache Spark legt Resilient Distributed Datasets (RDDs) mit dem MongoDB-Quellknoten zusammen, um die Datenbewegung im Cluster zu minimieren und die Latenz zu verringern.MongoDB und Apache Spark: die ideale Kombination für Datenexperten
China Eastern Airlines
Qumram
Stratio
Das Unternehmen Stratio hat seine Big Data-Plattform auf Pure Spark implementiert, die MongoDB mit Apache Spark, Zeppelin und Kafka kombiniert, um einen operativen Data Lake für Mutua Madrileña, eine der größten Versicherungsgesellschaften Spaniens, aufzubauen. Machine-Learning-Modelle wurden entwickelt, um das Kundenerlebnis zu personalisieren, mithilfe einer Analyse von Marketingkampagnen-Daten die Auswirkungen zu messen und die Leistung zu verbessern.
Globale Fluggesellschaft
Eine global agierende Fluggesellschaft konsolidiert Kundendaten, die auf mehr als 100 Systeme verteilt sind, in eine einheitliche MongoDB-Sicht. Während der Kunde das Online-Angebot des Unternehmens nutzt oder mit einem Callcenter-Mitarbeiter spricht, werden die von MongoDB verwalteten Kundendaten mithilfe von Spark-Prozessen analysiert. So können Kunden in Echtzeit eingestuft und mit personalisierten Angeboten versorgt werden.