BLOGAnnounced at MongoDB.local NYC 2024: A recap of all announcements and updates — Learn more >

¿Qué es la IA generativa?

A lo largo de 2023, en el mundo hubo un cambio transformador con el auge de la IA generativa (a menudo conocida simplemente como GenAI). A medida que surgieron aplicaciones revolucionarias para el contenido generado con IA, también surgió la sensación de que la IA generativa afectará radicalmente a todas las industrias y sectores de la sociedad.

Las organizaciones están compitiendo para capturar el potencial de la IA generativa. Si eso incluye a su organización, el primer punto en su orden del día es comprender las complejidades de la IA generativa. En esta publicación, cubriremos las siguientes preguntas clave (y más) para ayudarlo a orientarse.

Después de abordar estas preguntas, veremos cómo MongoDB puede ayudar a las organizaciones que buscan crear aplicaciones basadas en IA generativa.

Comencemos con una introducción a los conceptos básicos.

¿Qué es la IA generativa y cómo funciona?

La IA generativa se refiere a la rama de la inteligencia artificial que se enfoca en la creación de contenido nuevo y único—como texto, arte visual, música, código de software y más. A diferencia de la IA predictiva (o analítica), que utiliza el aprendizaje automático para analizar datos históricos, identificar patrones o tendencias y luego hacer predicciones, la IA generativa va un paso más allá de simplemente analizar y predecir: la IA generativa crea.

Por ejemplo, considere una herramienta de IA predictiva que se entrena con datos que consisten en millones de pinturas y sus artistas. Dada una pintura que nunca antes ha visto, la herramienta de IA predictiva puede determinar el artista. Sin embargo, un sistema de IA generativa puede producir una nueva pintura en el estilo específico de ese artista.

Imagen generada por IA como resultado de darle la indicación "pintura de una computadora al estilo de Mondrian" a DALL-E

Imagen generada por IA como resultado de darle la indicación "pintura de una computadora al estilo de Mondrian" a DALL-E

La IA generativa suele estar diseñada para imitar la inteligencia y la creatividad humanas, lo que significa que el contenido generado es relevante para el contexto y coherente. El contenido nuevo resuena con los patrones humanos de pensamiento y expresión. Pueden ser elementos visuales y arte de IA que son casi indistinguibles del contenido creado por humanos. Los resultados de una herramienta de IA generativa pueden ser la generación de texto o voz. De todos modos, los resultados son familiares, pero a la vez originales, innovadores y auténticos.

Al crear contenido relevante para el contexto mediante el razonamiento, se pueden aplicar capacidades de IA generativa a tareas empresariales como la planificación estratégica y la proyección, la resolución de problemas y el análisis hipotético.

Tipos de modelos de IA generativa

Los modelos de IA son conjuntos de algoritmos de IA que utilizan machine learning para identificar patrones de datos, lo que les permite hacer predicciones o generar datos novedosos que imitan la estructura y el estilo de los datos originales. El espacio de la IA está poblado por muchos tipos diferentes de modelos, el más conocido en la IA generativa hoy es el modelo de base.

Los modelos de base se entrenan previamente con grandes cantidades de datos. El modelo sirve como una “base” que se puede optimizar para tareas especializadas. Esto hace que un modelo de base sea increíblemente versátil y pueda utilizarse para muchas tareas diferentes. Un ejemplo de modelo de base es el modelo de lenguaje grande (LLM). GPT (que significa "transformador generativo preentrenado") de OpenAI es un LLM diseñado para trabajar con el lenguaje humano. Los LLM se centran en el procesamiento del lenguaje natural y pueden realizar tareas conversacionales como responder preguntas, chatbots, transcripción, traducción y más.

Otros tipos de modelos de base pueden enfocarse en el contenido no textual. Estos incluyen modelos de base visuales que generan imágenes, como Flamingo o DALL-E de OpenIA, o modelos de base de audio como UniAudio o LLark.

¿Qué es la generación aumentada por recuperación (RAG)?

Un LLM se limita a la información disponible hasta su última actualización de entrenamiento, por lo que no conoce los eventos o desarrollos que hayan ocurrido desde entonces. Entonces, ¿cómo podríamos aprovechar los LLM de manera que se tengan en cuenta nuevos datos?

Una opción es volver a entrenar u optimizar los modelos generativos con nuevos datos. Sin embargo, esto puede requerir mucho tiempo y recursos. Una mejor opción es la generación aumentada de recuperación (RAG). La RAG permite a un LLM extraer dinámicamente información externa en tiempo real durante el proceso de generación de contenido. Con la RAG, un sistema de IA generativa consulta una base de datos de información en tiempo real, lo que produce resultados más precisos, informados y relevantes para el contexto, incluso si el conocimiento requerido no era parte de los datos utilizados en un principio para el entrenamiento.

Sin embargo, para que la RAG recupere información relevante y semánticamente similar de un gran corpus de datos de manera eficiente, se basa en incrustaciones vectoriales, representaciones numéricas de datos en un espacio de alta dimensión. La forma óptima de almacenar y consultar estas incrustaciones es utilizar una base de datos vectorial.

Foto de Alina Grubnyak en Unsplash

Foto de Alina Grubnyak en Unsplash

La RAG amplía la capacidad de un LLM de mantenerse actualizado y versátil para generar contenido de alta calidad. Una cita de esta publicación resume bien lo que es la RAG:

La RAG rellena las lagunas de conocimiento en las que el LLM no estaba entrenado, y así convierte esencialmente la tarea de respuesta de preguntas en un "cuestionario de libro abierto", que es más fácil y menos complejo que una tarea de respuesta de preguntas abierta y sin límites.

La importancia de la IA generativa en el espacio de la IA

El papel de la IA generativa en la creación de contenido novedoso aporta un potencial transformador a todo lo relacionado con la IA. Los modelos de IA generativa pueden tener aplicaciones en todas las industrias, desde el entretenimiento hasta la atención médica. Las innovaciones en la investigación y la tecnología de la IA están continuamente ampliando las capacidades y aplicaciones de los modelos de IA generativa. Pronto, las capacidades de la IA generativa se convertirán en una parte esencial del moderno kit de herramientas de IA.

GPT hace posible el uso de IA generativa para la generación de imágenes, junto con modelos de difusión como difusión estable. Como resultado, el arte de la IA se ha convertido en un mercado enorme, con artistas que utilizan la IA generativa para crear imágenes realistas, casi indistinguibles de las imágenes naturales.

Mientras tanto, los profesionales del marketing utilizan la IA generativa para crear tuits de 180 caracteres sobre eventos de ventas, y los diseñadores utilizan la IA generativa para crear nuevos diseños de productos. Incluso las farmacéuticas utilizan IA generativa para ayudar en el descubrimiento de medicamentos.

Una imagen de libros en una estantería.

Foto de CHUTTERSNAP en Unsplash

El papel de los datos en la IA generativa

La eficacia y versatilidad de cualquier sistema de IA, lo que incluye los sistemas de IA generativa, depende de la calidad, cantidad y diversidad de los datos utilizados para entrenar sus modelos. Veamos algunos aspectos clave de la relación entre los datos y el modelo de IA generativa.

Datos de entrenamiento

Los modelos de IA generativa se entrenan en conjuntos de datos de gran tamaño. Un modelo diseñado para texto puede entrenarse con miles de millones de artículos, mientras que otro modelo diseñado para imágenes puede entrenarse con millones de imágenes. Los LLM necesitan grandes cantidades de datos de machine learning para generar contenidos coherentes y relevantes para el contexto. A medida que los datos son más variados y completos, mejora la capacidad del modelo para comprender y generar una amplia gama de contenido.

En términos generales, más datos se traducen en mejores resultados de modelos. Con un conjunto de datos más grande, los modelos de IA generativa pueden identificar patrones más sutiles, lo que lleva a resultados más precisos y matizados. Sin embargo, la calidad de los datos también es de suma importancia. A menudo, un conjunto de datos más pequeño y de alta calidad puede superar a uno más grande y menos relevante.

Datos sin procesar y complejos

Los datos sin procesar, en especial si son complejos y no estructurados, pueden requerir un procesamiento previo en las primeras etapas del pipeline de datos, antes de poder utilizarlos para el entrenamiento. Este también es el momento en que se validan los datos, para garantizar que sean una representación adecuada y no estén sesgados. Este paso de validación es crucial para evitar resultados sesgados.

Datos etiquetados frente a datos no etiquetados

Los datos etiquetados proporcionan información específica sobre cada punto de datos (por ejemplo, la descripción textual que acompaña a una imagen), mientras que los datos no etiquetados no incluyen anotaciones como ésta. Los modelos generativos a menudo funcionan bien con datos no etiquetados, ya que aún pueden aprender a generar contenido mediante la comprensión de estructuras y patrones inherentes.

Datos patentados

Algunos datos son exclusivos de una organización en particular. Los ejemplos incluyen el historial de pedidos del cliente, las métricas de desempeño de los empleados y los procesos de la empresa. Muchas empresas recopilan estos datos, los hacen anónimos para evitar que se filtren hacia abajo los PII o PHI confidenciales y luego realizan análisis de datos tradicionales. Estos datos contienen una gran cantidad de información que podría extraerse con aún más profundidad si se utilizara para entrenar un modelo generativo. Los productos resultantes se adaptarían a las necesidades y características específicas de esa empresa.

El papel de los datos en RAG

Como ya se mencionó, RAG combina la potencia de un LLM con la recuperación de datos en tiempo real. Con la RAG, ya no depende solo de los datos del entrenamiento previo. En cambio, puede ejecutar justo a tiempo una extracción de información relevante de bases de datos externas. Esto garantiza que el contenido generado sea actual y preciso.

Cómo aumentar los modelos de IA generativa con datos patentados

Cuando se trabaja con modelos generativos, la ingeniería de consulta es una técnica que implica elaborar consultas de entrada específicas o instrucciones para guiar el modelo, para que los resultados o respuestas se adapten mejor. Con la RAG, podemos aumentar las indicaciones con datos patentados y equipar el modelo de IA para generar respuestas relevantes y precisas con los datos empresariales tomados en cuenta. Este enfoque también es preferible al enfoque que requiere mucho tiempo y recursos para volver a entrenar u optimizar un LLM con estos datos.

Retos y consideraciones

Por supuesto, trabajar con IA generativa no está exento de retos. Si su organización está buscando aprovechar el potencial de GenAI, debe tener en cuenta las siguientes cuestiones clave.

Necesidad de experiencia en datos y una enorme potencia de procesamiento

Los modelos generativos requieren recursos esenciales. En primer lugar, necesita la experiencia de científicos de datos e ingenieros capacitados. Con la excepción de las organizaciones de datos, la mayoría de las empresas no tienen equipos con las habilidades especializadas que se necesitarían para entrenar u optimizar los LLM.

Cuando se trata de recursos informáticos, el entrenamiento de un modelo con datos completos puede requerir semanas o meses, y esto pasa incluso si utiliza GPU o TPU potentes. Y aunque la optimización de un LLM puede no requerir tanta potencia de procesamiento como entrenar uno desde cero, aún requiere una significativa cantidad de recursos.

El entrenamiento intensivo con recursos y la optimización de un LLM es lo que convierte a la RAG en una técnica alternativa atractiva para incorporar datos actuales (y patentados) con los datos existentes disponibles a un LLM ya entrenado.

Consideraciones éticas

El auge de la IA generativa también suscitó un intenso debate sobre las consideraciones éticas que conlleva su desarrollo y uso. A medida que las aplicaciones de IA generativa se generalizan y se hacen más accesibles al público, las conversaciones se centraron en cómo:

  • Cómo garantizar modelos equitativos y libres de sesgos
  • Cómo protegerse contra ataques como la contaminación o manipulación de modelo
  • Cómo evitar la propagación de la desinformación
  • Cómo protegerse contra el uso indebido de la IA generativa (como los deepfakes o generación de información engañosa)
  • Cómo conservar la atribución
  • Cómo fomentar la transparencia con los usuarios finales, para que sepan cuándo están interactuando con un chatbot de IA generativa en lugar de con un humano
Comparación con otras herramientas y sistemas de IA

El entusiasmo por las herramientas de IA generativa y su novedad eclipsaron el panorama más amplio de herramientas y sistemas de IA. Muchos se equivocan al suponer que la IA generativa es la herramienta de IA que resolverá todos sus problemas. Sin embargo, aunque la IA generativa se destaca en la creación de nuevos contenidos, otras herramientas de IA podrían resultar más adecuadas para determinadas tareas empresariales. Las ventajas de la IA generativa, al igual que con cualquier otra herramienta de su pila, deben sopesarse con las ventajas de otras herramientas.

Retos específicos de la GAR

El enfoque de la GAR para aprovechar un LLM es potente, pero también conlleva su propio conjunto de retos.

  • Elegir vector Database y tecnologías de búsqueda: En última instancia, la eficiencia del enfoque GAR depende de su capacidad para recuperar datos relevantes rápidamente. Esto hace que la selección de una vector database y la tecnología de búsqueda sea una decisión crítica que afectará el rendimiento de RAG. Coherencia de datos: debido a que la RAG extrae datos en tiempo real, es esencial garantizar que la vector database esté actualizada y sea coherente.
  • Complejidad de la integración: la integración de RAG con un LLM agrega una capa de complejidad a sus sistemas. La implementación eficaz de la IA generativa con RAG puede requerir experiencia especializada.

A pesar de estos desafíos, la RAG brinda a las organizaciones un medio sencillo y poderoso para aprovechar sus datos operativos y de aplicaciones para obtener información estratégica rica e informar decisiones comerciales críticas.

MongoDB Atlas para aplicaciones impulsadas por GenAI

Hablamos del potencial transformador de la IA generativa y vimos la poderosa mejora de los datos en tiempo real que viene con RAG. La unión de estas tecnologías requiere una plataforma de datos flexible que ofrezca un conjunto de funciones adaptadas a las aplicaciones impulsadas por GenAI. Para las organizaciones que se avecinan en el mundo de la IA generativa y RAG, MongoDB Atlas será el que cambie las reglas del juego.

Las características principales de MongoDB Atlas incluyen:

  • Capacidades nativas de búsqueda de vectores: El almacenamiento y la búsqueda de vectores nativos están integrados en MongoDB Atlas, lo que garantiza una recuperación de datos rápida y eficiente para RAG sin la necesidad de una base de datos adicional para manejar vectores.
  • API unificada y modelo de documento flexible: La API unificada de MongoDB Atlas permite a los desarrolladores combinar la búsqueda vectorial con otras capacidades de consulta, como la búsqueda estructurada o la búsqueda de texto. Esto, junto con el modelo de datos de documentos de MongoDB, aporta una flexibilidad increíble a su implementación.
  • Escalabilidad, confiabilidad y seguridad: MongoDB Atlas ofrece escalado horizontal para crecer fácilmente a medida que crece (y sus datos). Con tolerancia a fallas y escalado horizontal y vertical simple, MongoDB Atlas garantiza un servicio ininterrumpido independientemente de sus demandas de carga de trabajo. Y, por supuesto, MongoDB muestra cómo prioriza la seguridad habilitando un cifrado de datos líder en la industria que se puede consultar.
Una imagen de MongoDB Atlas realizando múltiples tareas para ayudar a las apps generativas impulsadas por IA.

MongoDB Atlas es fundamental para simplificar la implementación de un sistema LLM mejorado por RAG. Al gestionar sus servicios de datos de IA generativa, MongoDB agiliza su proceso de creación de apps preparadas para la empresa e impulsadas por GenAI. Ya sea que los datos que desee incorporar sean datos patentados o datos de eventos actualizados al minuto, MongoDB hace que el enfoque RAG sea alcanzable. En una encuesta reciente sobre el estado de la IA realizada a 1500 encuestados, MongoDB Atlas Vector Search obtuvo la mayor satisfacción de los desarrolladores entre todas las soluciones vectoriales.

Conclusión

Como subconjunto de la inteligencia artificial, la IA generativa, que utiliza modelos entrenados con grandes cantidades de contenido existente para crear contenido nuevo y único, representa un salto transformador en la tecnología moderna. Sin embargo, para que la IA generativa cumpla con la promesa de imitar la inteligencia humana y la creatividad, debe capacitarse en grandes volúmenes de datos de alta calidad. La efectividad de un modelo de IA generativa depende de la calidad, cantidad y diversidad de los datos con los que se entrena.

Los datos disponibles para un LLM están limitados por la última actualización de entrenamiento para ese LLM. La incorporación de datos actualizados no puede lograrse mediante el reentrenamiento o la optimización del modelo, porque en cuanto se completan esos procesos, los datos quedan obsoletos. La solución es la RAG, que consulta los datos actualizados de una vector database como parte de la tarea de ingeniería rápida. La RAG mejora los LLM al proporcionarles la capacidad de acceder a información actual y relevante que puede incluir información de propiedad exclusiva de una organización sin la intensidad de recursos que supone la formación o la optimización.

Para hacerlo posible, las empresas recurren a MongoDB Atlas. Sus capacidades de búsqueda vectorial nativa, junto con su API unificada y su modelo de documento flexible, lo convierten en una opción atractiva para las empresas que buscan mejorar un LLM con el enfoque RAG para extraer datos propios.

Primeros pasos con MongoDB Atlas

Probar Gratis