Sommario
- IA generativa, database vettoriali e MongoDB Atlas Vector Search
- Cosa sono i database vettoriali?
- Come funzionano i database vettoriali?
- Perché la ricerca vettoriale è fondamentale?
- Casi d'uso dei database vettoriali
- MongoDB Atlas Vector Search: un punto di svolta
- Atlas Vector Search: per applicazioni intelligenti basate sulla ricerca semantica
- Domande frequenti
IA generativa, database vettoriali e MongoDB Atlas Vector Search
Grande clamore attorno all'IA generativa (nota anche come intelligenza artificiale). In tutti i settori dell'economia, dalla sanità alla finanza, dal commercio al dettaglio alla PA, le organizzazioni cercano di capire come servirsene. Sembra che tutti i CEO vogliano implementare le applicazioni il più velocemente possibile.
E non si tratta solo di clamore. Secondo un rapporto di McKinsey, l'IA generativa potrebbe portare all'economia globale un'iniezione di fondi dell'ordine di migliaia di miliardi.
Al centro di questa tecnologia di trasformazione c’è il concetto matematico di vettore. Attraverso la vettorizzazione e le prodezze degli LLM, l'IA generativa raggiunge il suo potenziale rivoluzionario. Nell’era dell'IA generativa, gli incorporamenti vettoriali gettano le basi; i database vettoriali ne amplificano l'impatto.
Che cos'è un database vettoriale? Come funziona? Quali sono alcuni casi d'uso comuni? E perché MongoDB Atlas Vector Search svolge un ruolo importante nel dibattito sull'IA generativa?
Che cosa sono i database vettoriali?
Per comprendere i database vettoriali, occorre innanzitutto capire cos'è un vettore.
In matematica e fisica, un vettore è una quantità che ha sia una grandezza (o dimensione) che una direzione. Un vettore può essere scomposto in componenti. Ad esempio, in uno spazio bidimensionale, un vettore ha una componente X (orizzontale) e una componente Y (verticale).
Nella scienza dei dati e nell'apprendimento automatico, un vettore è un elenco ordinato o una sequenza di numeri che rappresenta i dati. Un vettore può rappresentare qualsiasi tipo di dati, inclusi i dati non strutturati (o dati senza un modello dati o uno schema predefinito), dal testo alle immagini, dall'audio al video. Un vettore è generalmente rappresentato come matrici o elenchi di numeri in cui ogni numero nell'elenco rappresenta una caratteristica o un attributo specifico di quei dati.
Si immagini, ad esempio, di avere una vasta raccolta di foto di gatti. Ogni immagine è un dato non strutturato. Ma si può rappresentare ogni immagine come un vettore estraendo caratteristiche come:
- Colore medio
- Istogramma del colore
- Istogramma della texture
- La presenza o l'assenza di orecchie, baffi e coda
Gli incorporamenti vettoriali (o vettorizzazione) indicano il processo di conversione di queste parole e altri dati in numeri, in cui ciascun punto dati è rappresentato da un vettore nello spazio ad alta dimensione.
Un database vettoriale, noto anche come database di ricerca vettoriale o motore di ricerca per somiglianza vettoriale, archivia, recupera e cerca vettori.
Invece delle righe e delle colonne tipiche dei relational database, i database vettoriali rappresentano i dati come punti in uno spazio multidimensionale. I database vettoriali sono ideali per le applicazioni che richiedono una corrispondenza rapida e accurata dei dati basata sulla somiglianza anziché su valori esatti.
“Possiamo immaginare un database vettoriale come un vasto magazzino e l’intelligenza artificiale come un abile responsabile di magazzino. In questo magazzino, ogni articolo (dati) è immagazzinato in una scatola (vettore), ordinatamente organizzata su scaffali in uno spazio multidimensionale", scrive Mark Hinkle in The New Stack.
Se si stanno creando applicazioni di IA generativa, un database vettoriale viene adattato per elaborare in modo efficiente grandi volumi di dati vettoriali, garantendo query e velocità di elaborazione più veloci.