AnnuncioTi presentiamo MongoDB 8.0, il MongoDB più veloce di sempre! Leggi >
AnnuncioVoyage AI si unisce a MongoDB per potenziare applicazioni AI più accurate e affidabili su Atlas. Scopra di più >

Connettori

Connettore MongoDB per Apache Spark

Crea nuovi sofisticati strumenti di real-time analytics combinando Apache Spark, il motore di elaborazione dati leader di settore, con MongoDB, il database in più rapida crescita. Il connettore MongoDB per Apache Spark è attualmente disponibile, certificato e supportato per l'uso in produzione.
Scarica ora

Accedi subito agli insight

Viviamo in un mondo di "big data". Ma il valore non sta tanto nei dati in sé: sta negli insight che se ne possono trarre. E la rapidità con cui un'azienda riesce a estrarre tali insight e ad agire di conseguenza è diventata un fattore cruciale di vantaggio competitivo. Non è più sufficiente acquisire i dati dai sistemi aziendali e quindi affidarsi a processi ETL batch notturni per aggiornare il data warehouse.

Un'illustrazione di un grafico a barre crescente e di una navicella spaziale
Un diagramma che descrive l'applicazione di analytics facilitata dal connettore per Apache Spark

Libera la potenza di Apache Spark

Il connettore MongoDB per Apache Spark espone tutte le librerie di Spark, comprese Scala, Java, Python e R. I dati di MongoDB vengono materializzati come DataFrame e Dataset per l'analisi con API di apprendimento automatico, grafici, streaming e SQL.

Sfrutta la potenza di MongoDB

Il connettore MongoDB per Apache Spark può sfruttare l'aggregation pipeline di MongoDB e gli indici secondari avanzati per estrarre, filtrare ed elaborare solo i dati necessari, ad esempio analizzando tutti i clienti che si trovano in un'area geografica specifica. Gli archivi dati NoSQL tradizionali non offrono indici secondari o aggregazioni nel database. In questi casi Spark dovrebbe estrarre tutti i dati in base a una semplice chiave primaria, anche se per il processo da eseguire necessita solo di un sottoinsieme di tali dati. Il connettore MongoDB per Apache Spark posiziona gli RDD (Resilient Distributed Dataset) con il nodo MongoDB di origine per ridurre al minimo lo spostamento dei dati nel cluster e ridurre la latency.
Un'illustrazione di una pipeline di aggregazione con flusso di dati

MongoDB e Apache Spark: il duo vincente per la moderna scienza dei dati

MongoDB offre già in modo nativo sofisticate funzionalità di real-time analytics. Vi sono tuttavia casi d'uso dove l'integrazione del motore Apache Spark può ampliare le capacità di elaborazione dei dati operativi gestiti da MongoDB. Ciò consente agli utenti di sfruttare attivamente i risultati generati da Spark all'interno dei processi aziendali in tempo reale supportati da MongoDB.
industry_airline_app

China Eastern Airlines

Essendo una delle maggiori compagnie aeree del mondo, China Eastern esplora costantemente le tecnologie emergenti per identificare nuovi modi per migliorare l'esperienza del cliente e ridurre i costi. China Eastern Airlines utilizza il connettore MongoDB per Apache Spark nel suo nuovo motore di calcolo delle tariffe, che serve 1,6 miliardi di query al giorno.
Ulteriori informazioni
industry_finance

Qumram

Qumram espone i dati della sessione utente memorizzati in MongoDB ai processi di apprendimento automatico di Spark per aiutare le istituzioni finanziarie globali a rilevare le frodi attraverso gli analytics comportamentali e ad applicare tecniche di apprendimento profonde per sentiment analysis con Natural Language Processing.
Ulteriori informazioni
cloud_iot

Stratio

Stratio ha implementato la sua piattaforma di big data Pure Spark, combinando MongoDB con Apache Spark, Zeppelin e Kafka, per creare un data lake operativo per Mutua Madrileña, una delle maggiori compagnie assicurative spagnole. I modelli di apprendimento automatico sono costruiti per personalizzare l'esperienza del cliente, con l'analisi dei dati delle campagne di marketing per misurare l'impatto e migliorare le prestazioni.

Ulteriori informazioni
industry_airline_app

Compagnia aerea globale

Una compagnia aerea globale ha unificato i dati dei clienti sparsi attraverso più di 100 sistemi in una visualizzazione singola in MongoDB. I processi Spark vengono eseguiti sui dati operativi attivi in MongoDB per aggiornare le classificazioni dei clienti e personalizzare le offerte in tempo reale, mentre il cliente interagisce sul Web o comunica con il call center.

Prossimi passi

general_action_download

Scarica

Il connettore MongoDB per Apache Spark è disponibile per il download su GitHub.

Scarica ora
general_content_learn

Impara

Leggi il nostro nuovo white paper: Trasformare gli analytics in azione immediata con Apache Spark e MongoDB.

Ulteriori informazioni
general_action_audit

Esplora

Sfoglia la documentazione del connettore MongoDB per Apache Spark nella nostra libreria di documenti.

Visualizza documenti

Pronto per iniziare?

Scarica il connettore MongoDB per Apache Spark.
Provalo oraContatta il reparto vendite
Database illustration