Connettori
Connettore MongoDB per Apache Spark
Accedi subito agli insight
Viviamo in un mondo di "big data". Ma il valore non sta tanto nei dati in sé: sta negli insight che se ne possono trarre. E la rapidità con cui un'azienda riesce a estrarre tali insight e ad agire di conseguenza è diventata un fattore cruciale di vantaggio competitivo. Non è più sufficiente acquisire i dati dai sistemi aziendali e quindi affidarsi a processi ETL batch notturni per aggiornare il data warehouse.
Libera la potenza di Apache Spark
Il connettore MongoDB per Apache Spark espone tutte le librerie di Spark, comprese Scala, Java, Python e R. I dati di MongoDB vengono materializzati come DataFrame e Dataset per l'analisi con API di apprendimento automatico, grafici, streaming e SQL.
Sfrutta la potenza di MongoDB
Il connettore MongoDB per Apache Spark può sfruttare l'aggregation pipeline di MongoDB e gli indici secondari avanzati per estrarre, filtrare ed elaborare solo i dati necessari, ad esempio analizzando tutti i clienti che si trovano in un'area geografica specifica. Gli archivi dati NoSQL tradizionali non offrono indici secondari o aggregazioni nel database. In questi casi Spark dovrebbe estrarre tutti i dati in base a una semplice chiave primaria, anche se per il processo da eseguire necessita solo di un sottoinsieme di tali dati. Il connettore MongoDB per Apache Spark posiziona gli RDD (Resilient Distributed Dataset) con il nodo MongoDB di origine per ridurre al minimo lo spostamento dei dati nel cluster e ridurre la latency.MongoDB e Apache Spark: il duo vincente per la moderna scienza dei dati
China Eastern Airlines
Qumram
Stratio
Stratio ha implementato la sua piattaforma di big data Pure Spark, combinando MongoDB con Apache Spark, Zeppelin e Kafka, per creare un data lake operativo per Mutua Madrileña, una delle maggiori compagnie assicurative spagnole. I modelli di apprendimento automatico sono costruiti per personalizzare l'esperienza del cliente, con l'analisi dei dati delle campagne di marketing per misurare l'impatto e migliorare le prestazioni.
Compagnia aerea globale
Una compagnia aerea globale ha unificato i dati dei clienti sparsi attraverso più di 100 sistemi in una visualizzazione singola in MongoDB. I processi Spark vengono eseguiti sui dati operativi attivi in MongoDB per aggiornare le classificazioni dei clienti e personalizzare le offerte in tempo reale, mentre il cliente interagisce sul Web o comunica con il call center.