David Macias

13 results

Vaya de 0 a 1 a listo para empresas con MongoDB Atlas y LLM

Crear experiencias convincentes y verdaderamente diferenciadas para sus clientes a partir de aplicaciones enriquecidas con IA generativa significa basar la inteligencia artificial en la verdad. Esa verdad proviene de sus datos, más específicamente, de sus datos operativos más actualizados. Ya sea que brinde experiencias hiperpersonalizadas con búsqueda semántica avanzada o produzca contenido y conversaciones solicitadas por el usuario, MongoDB Atlas unifica los servicios de datos operativos, analíticos y de búsqueda vectorial para optimizar la incorporación del poder de los LLM y los modelos transformadores en sus aplicaciones. Cada día, los desarrolladores crean la próxima aplicación innovadora y transformadora basada en IA generativa. Los LLM comerciales y de código abierto están avanzando a una velocidad vertiginosa. Los marcos y las herramientas para construirlos son abundantes y democratizan la innovación. Y, sin embargo, llevar estas aplicaciones del prototipo a que estén listas para uso empresarial es el abismo que los equipos de desarrollo deben cruzar. En primer lugar, estos grandes modelos pueden ofrecer respuestas incorrectas o desinformadas, porque los datos a los que tienen acceso son antiguos. Hay dos opciones para resolver respuestas desinformadas: afinar un modelo grande o dotarlo de memoria a largo plazo. Sin embargo, esto conlleva un segundo obstáculo: desplegar una aplicación en torno a un LLM informado con los controles de seguridad adecuados y a la escala y el rendimiento que esperan los usuarios. Los desarrolladores necesitan una plataforma de datos que tenga la flexibilidad del modelo de datos para adaptarse a los datos estructurados y no estructurados en constante cambio que informen a los grandes modelos sin obstaculizar los esquemas rígidos. Aunque afinar un modelo es una opción, su costo es prohibitivo en términos de tiempo y recursos informáticos. Esto significa que los desarrolladores deben poder presentar datos como contexto para los grandes modelos como parte de las indicaciones. Necesitan dar a estos modelos generativos memoria a largo plazo. A continuación, analizamos algunos ejemplos de cómo hacerlo con diversos LLM y marcos de IA generativa. Consulte nuestra página de recursos de IA para obtener más información sobre la creación de aplicaciones impulsadas por IA con MongoDB. Cinco recursos para empezar a usar MongoDB Atlas y LLM MongoDB Atlas permite integrar sin problemas los principales servicios y sistemas de IA generativa, como los hiperescaladores y los LLM y marcos de código abierto. Al combinar los almacenes de datos de incrustación de documentos y vectores en un solo lugar a través de Atlas Database y Atlas Vector Search (vista previa), los desarrolladores pueden acelerar la creación de sus aplicaciones enriquecidas con IA generativa que se basan en la verdad de los datos operativos. A continuación, se muestran ejemplos de cómo trabajar con marcos LLM populares y MongoDB: 1. Comience con Atlas Vector Search (vista previa) y OpenAI para Semantic Search Este tutorial explica los pasos para realizar una semantic search en un conjunto de datos de películas de muestra con MongoDB Atlas. Primero, establecerá un desencadenador de Atlas para realizar una llamada a una API de OpenAI cada vez que se inserte un nuevo documento en su cluster, para convertirlo en una inserción de vector. Luego, realizará una consulta de búsqueda de vectores usando Atlas Vector Search. Incluso hay una sección especial de bonificaciones para aprovechar los modelos de HuggingFace. Lea el tutorial . 2. Desarrolle una aplicación de chat enriquecida con AI generativa con sus propios datos utilizando Llamalndex y MongoDB LlamaIndex proporciona una interfaz simple y flexible para conectar LLM con datos externos. Este blog conjunto de LlamaIndex y MongoDB incluye más detalles sobre por qué y cómo podría querer crear su propia aplicación de chat. El cuaderno adjunto en el blog proporciona un tutorial de código sobre cómo consultar cualquier documento PDF usando consultas en inglés. Lea el blog . 3. Consulte los docs sobre cómo usar Atlas Vector Search (vista previa) como tienda vectorial con LangChain Como se indica en la publicación del blog del anuncio de la asociación, LangChain y MongoDB Atlas encajan de forma natural, y se ha demostrado por el entusiasmo orgánico de la comunidad que ha llevado a varias integraciones en LangChain para MongoDB. Además de ahora admitir Atlas Vector Search como una tienda de vectores, ya hay asistencia técnica para utilizar MongoDB como un historial de registro de chat. Lea los docs: python , javascript . 4. Genere predicciones directamente en MongoDB Atlas con MindsDB AI Collections MindsDB es una plataforma de aprendizaje automático de código abierto que aporta machine learning automatizado a la base de datos. En este blog, generará predicciones directamente en Atlas con MindsDB AI Collection, lo que le dará la capacidad de consumir predicciones como datos regulares, consultar estas predicciones y acelerar la velocidad de desarrollo simplificando los flujos de trabajo de implementación. Lea el blog . 5. Integre modelos de transformador HuggingFace en MongoDB Atlas con los desencadenadores de Atlas HuggingFace es una comunidad de IA que facilita la construcción, capacitación e implementación de modelos de machine learning. Aprovechar los disparadores de Atlas junto con HuggingFace le permite reaccionar fácilmente a los cambios en los datos operativos que proporcionan memoria a largo plazo a sus modelos. Aprenda a configurar disparadores para predecir automáticamente el sentimiento de los nuevos documentos en su base de datos MongoDB y agregarlos como campos adicionales a sus documentos. Consulte el repositorio de GitHub . Figura 1: La arquitectura de la aplicación de muestra enseña cómo los datos externos o patentados proporcionan memoria a largo plazo a un LLM y cómo los datos fluyen desde la entrada de un usuario a una respuesta impulsada por LLM. Del prototipo a la producción con MongoDB para aplicaciones enriquecidas con IA generativa La plataforma de datos para desarrolladores de MongoDB basada en Atlas ofrece una experiencia moderna y optimizada para los desarrolladores, al tiempo que ha sido probada por miles de empresas de todo el mundo para funcionar a escala y de forma segura. Ya sea que esté construyendo la próxima gran novedad en una startup o empresa, Atlas le permite: Acelerar la creación de sus aplicaciones enriquecidas con IA generativa que se basan en la verdad de los datos operativos. Simplificar la arquitectura de su aplicación aprovechando una única plataforma que les permite almacenar datos vectoriales y de aplicaciones en el mismo lugar, reaccionar a los cambios en los datos fuente con funciones serverless y buscar en múltiples modalidades de datos para mejorar la relevancia y precisión en las respuestas que generan sus aplicaciones. Haga evolucionar fácilmente sus aplicaciones enriquecidas con IA generativa con la flexibilidad del modelo de documentos y, al mismo tiempo, mantenga una experiencia de desarrollador simple y elegante. Integre a la perfección los principales servicios y sistemas de IA, como los hiperescaladores y los LLM y marcos de código abierto, para seguir siendo competitivo en mercados dinámicos. Desarrolle aplicaciones enriquecidas con IA generativa en una base de datos operativa de alto rendimiento y altamente escalable que ha tenido una década de validación en una amplia variedad de casos de uso de IA. Aunque estos ejemplos son los cimientos de algo más innovador, MongoDB puede ayudarle a pasar del concepto a la producción a escala. Comience hoy registrándose en el nivel gratuito de MongoDB Atlas e integrándolo con sus marcos y LLM preferidos. Si está interesado en trabajar con nosotros más de cerca, consulte nuestro programa MongoDB AI Innovators , que permite la innovación en inteligencia artificial y muestra soluciones de vanguardia de startups, clientes y socios.

June 22, 2023

Vá de 0 a 1 para pronto para a empresa com o MongoDB Atlas e LLMs

Criar experiências atraentes e verdadeiramente diferenciadas para seus clientes a partir de aplicações enriquecidas com IA generativa significa fundamentar a inteligência artificial na verdade. Essa verdade vem de seus dados, mais especificamente, de seus dados operacionais mais atualizados. Não importa se você está fornecendo experiências hiperpersonalizadas com Semantic search avançada ou produzindo conteúdo e conversas solicitados pelo usuário, o MongoDB Atlas unifica serviços de dados de pesquisa operacional, analítica e vetorial para simplificar a incorporação do poder de LLMs e modelos de transformação em seus aplicativos. Todos os dias, desenvolvedores estão construindo a próxima aplicação inovadora e transformadora alimentada por IA generativa. Os LLMs comerciais e de código aberto estão avançando a uma velocidade vertiginosa. Não importa se você está fornecendo experiências hiperpersonalizadas com Semantic search avançada ou produzindo conteúdo e conversas solicitados pelo usuário, o MongoDB Atlas unifica serviços de dados de pesquisa operacional, analítica e vetorial para simplificar a incorporação do poder de LLMs e modelos de transformação em seus aplicativos.E, no entanto, levar essas aplicações do protótipo ao pronto para a empresa é o abismo que as equipes de desenvolvimento devem atravessar. Primeiro, esses grandes modelos podem fornecer respostas incorretas ou não informadas, pois os dados aos quais eles têm acesso são datados. Há duas opções para resolver respostas desinformadas: ajustar um modelo grande ou fornecer-lhe memória de longo prazo. No entanto, isso gera uma segunda barreira: implantar uma aplicação em torno de um LLM informado com os controles de segurança corretos em vigor e na escala e no desempenho que os usuários esperam. Os desenvolvedores precisam de uma plataforma de dados que tenha a flexibilidade do modelo de dados para se adaptar aos dados estruturados e não estruturados em constante mudança que informam grandes modelos sem o impedimento de esquemas rígidos. Embora o ajuste fino de um modelo seja uma opção, ele tem um custo proibitivo em termos de tempo e recursos computacionais. Isso significa que os desenvolvedores precisam ser capazes de apresentar dados como contexto para grandes modelos como parte das solicitações. Eles precisam dar a esses modelos generativos uma memória de longo prazo. Abaixo, discutiremos alguns exemplos de como fazer isso com vários LLMs e estruturas de IA generativa. Confira nossa página Recursos de IA para saber mais sobre a construção de aplicativos baseados em IA com o MongoDB. Cinco recursos para começar a usar o Atlas MongoDB e LLMs O MongoDB Atlas simplifica a integração dos principais serviços e sistemas de IA generativa, como hiperescaladores e LLMs e estruturas de código aberto. Ao combinar documentos e vetores incorporando armazenamentos de dados em um local via Atlas Database e Atlas Vector Search (pré-visualização), os desenvolvedores podem acelerar a construção de suas aplicações enriquecidas por IA generativa que são fundamentadas na verdade dos dados operacionais. Veja abaixo exemplos de como trabalhar com estruturas populares de LLM e o MongoDB: 1. Introdução ao Atlas Vector Search (pré-visualização) e OpenAI para Semantic search Este tutorial orienta você nas etapas de realização da Semantic search em uma amostra de conjuntos de dados de filmes com o MongoDB Atlas. Primeiro, você configurará um Atlas Trigger para fazer uma chamada para uma API do OpenAI sempre que um novo documento for inserido em seu cluster, para convertê-lo em uma incorporação vetorial. Em seguida, você executará uma query de pesquisa vetorial utilizando o Atlas Vector Search. Há até uma seção de bônus especial para aproveitar os modelos do HuggingFace. Leia o tutorial . 2. Construa um aplicativo de chat enriquecido com IA generativa com seus dados proprietários usando o Llamalndex e MongoDB O LlamaIndex oferece uma interface simples e flexível para conectar LLMs a dados externos. Este blog conjunto do LlamaIndex e MongoDB traz mais detalhes sobre o motivo e como você pode querer construir seu próprio aplicativo de chat. O notebook anexado no blog fornece um passo a passo de código sobre como consultar qualquer documento PDF usando queries no idioma inglês. Leia o blog . 3. Veja os documentos para saber como usar o Atlas Vector Search (pré-visualização) como um armazenamento vetorial com o LangChain Conforme declarado na postagem do blog de anúncio da parceria, o LangChain e o MongoDB Atlas são uma combinação natural, e isso foi demonstrado pelo entusiasmo da comunidade orgânica que levou a várias integrações no LangChain para o MongoDB. Além de agora oferecer suporte ao Atlas Vector Search como um armazenamento vetorial, já existe suporte para utilizar o MongoDB como um histórico de registro de bate-papo. Leia os documentos: Python , JavaScript . 4. Gere previsões diretamente no MongoDB Atlas com coleções de IA do MindsDB O MindsDB é uma plataforma de machine learning de código aberto que traz machine learning automatizado para o banco de dados. Neste blog, você gerará previsões diretamente no Atlas com coleções de IA do MindsDB, dando-lhe a capacidade de consumir previsões como dados regulares, consultar estas previsões e acelerar a velocidade de desenvolvimento simplificando fluxos de trabalho de implantação. Leia o blog . 5. Integre modelos de transformação do HuggingFace no MongoDB Atlas com o Atlas Triggers O HuggingFace é uma comunidade de IA que facilita a construção, o treinamento e a implantação de modelos de machine learning. Aproveitar o Atlas Triggers junto com o HuggingFace permite que você reaja facilmente às alterações nos dados operacionais que fornecem memória de longo prazo para seus modelos. Saiba como configurar o Triggers para prever automaticamente o sentimento de novos documentos em seu banco de dados do MongoDB e acrescentá-los como campos adicionais a seus documentos. Consulte o repositório do GitHub . Figura 1: a arquitetura do aplicativo de amostra mostra como os dados externos ou proprietários fornecem memória de longo prazo a um LLM e como os dados fluem da entrada de um usuário para uma resposta alimentada por LLM. Do protótipo à produção com o MongoDB para aplicativos enriquecidos com IA generativa A plataforma de dados do desenvolvedor do MongoDB construída no Atlas fornece uma experiência de desenvolvedor moderna e otimizada, ao mesmo tempo em que é testada por milhares de empresas em todo o mundo para ter um desempenho em escala e com segurança. Quer você esteja construindo a próxima grande novidade em uma startup ou grande empresa, o Atlas permite que você: Acelere a construção de suas aplicações enriquecidas com IA generativa que são fundamentados na verdade dos dados operacionais. Simplifique a arquitetura de seu aplicativo aproveitando uma única plataforma que permite armazenar dados do aplicativo e vetoriais no mesmo lugar, reagir a alterações nos dados de origem com funções serverless e pesquisar em várias modalidades de dados para melhorar a relevância e a precisão nas respostas geradas por seus aplicativos. Evolua facilmente seus aplicativos enriquecidos com IA generativa com a flexibilidade do modelo de documento e, ao mesmo tempo, mantenha uma experiência de desenvolvedor simples e elegante. Integre perfeitamente os principais serviços e sistemas de IA, como os hiperescaladores e LLMs e estruturas de código aberto, para manter a competitividade em mercados dinâmicos. Construa aplicações enriquecidas com IA generativa em um banco de dados operacional de alto desempenho e altamente escalável, que teve uma década de validação em uma ampla variedade de casos de uso de IA. Embora esses exemplos sejam os blocos de construção para algo mais inovador, o MongoDB pode ajudá-lo a ir do conceito à produção e à escala. Comece hoje mesmo inscrevendo-se no nível gratuito do MongoDB Atlas e integrando-o a suas estruturas e LLMs preferidos. Se você está interessado em trabalhar conosco mais de perto, confira nosso programa MongoDB AI Innovators , que permite a inovação em inteligência artificial e apresenta soluções de ponta de startups, clientes e parceiros.

June 22, 2023

利用 MongoDB Atlas 和大型语言模型实现从 0 到 1 的企业级支持

通过生成式 AI 密集型应用程序为您的客户打造引人入胜、真正的差异化体验意味着人工智能的实现要以事实为基础。这个事实来自您的数据,更具体地说,是您最新的运营数据。无论您通过高级语义搜索提供超个性化体验,还是生成用户提示的内容和对话,MongoDB Atlas 通过统一操作、分析和矢量搜索数据服务,简化了将大型语言模型和转换器模型的功能嵌入到您的应用的过程。 每天,开发者都在构建下一个突破性、变革性的生成式 AI 驱动的应用程序。商用和开源大型语言模型正在以惊人的速度发展。围绕它们构建的框架和工具丰富多样,实现了创新大众化。然而,将这些应用程序从原型转变为企业级支持是开发团队必须跨越的鸿沟。首先,这些大型模型可能会提供不正确或不知情的回答,因为它们访问的数据已过时。有两种选择可以解决不知情的回答 — 微调大型模型或为其提供长期记忆。然而,这样做会带来又一阻碍 — 围绕已知情大型语言模型部署应用程序需要采取适当的安全控制措施,并且达到用户期望的规模和性能水平。 开发者需要一个数据模型灵活的数据平台,以适应不断变化的非结构化和结构化数据,为大型模型提供信息,而不受严格模式的阻碍。虽然微调模型是一种选择,但就时间和计算资源而言,这是一种成本高昂的选择。这意味着开发者需要能够将数据作为大型模型的上下文呈现,以成为提示的一部分。他们需要赋予这些生成式模型长期记忆。我们将在以下部分提供几个示例,以讨论如何使用各种大型语言模型和生成式 AI 框架实现这一目标。 查看我们的 AI 资源页面 ,了解有关使用 MongoDB 构建 AI 驱动的应用的更多信息。 开始使用 MongoDB Atlas 和大型语言模型的五个资源 MongoDB Atlas 可以无缝集成领先的生成式 AI 服务和系统,例如超大规模服务提供商以及开源大型语言模型和框架。通过 Atlas 数据库和 Atlas Vector Search (预览版)将文档和矢量嵌入数据存储到一处,开发者可以加速构建基于真实运营数据的生成式 AI 密集型应用程序。以下是如何使用常用 LLM 框架和 MongoDB 的示例: 1. 开始使用 Atlas Vector Search(预览版)和 OpenAI 进行语义搜索 本教程将引导您完成使用 MongoDB Atlas 对示例电影数据集执行语义搜索的步骤。首先,您将设置一个 Atlas Trigger,以便在将新文档插入集群时调用 OpenAI API,从而将其转换为矢量嵌入。然后,您将使用 Atlas Vector Search 执行矢量搜索查询。甚至还有一个利用 HuggingFace 模型的特殊奖励部分。 阅读教程 。 2. 使用 Llamalndex 和 MongoDB 构建拥有专有数据的生成式 AI 密集型聊天应用 LlamaIndex 提供了一个简单、灵活的接口将大型语言模型与外部数据连接起来。这篇由 LlamaIndex 和 MongoDB 联合撰写的博客更详细地介绍了为何以及如何构建自己的聊天应用。博客中随附的笔记本提供如何使用英语查询来查询任何 PDF 文档的代码演示。 阅读博客 。 3. 参阅文档了解如何使用 Atlas Vector Search(预览版)作为 LangChain 的矢量存储 正如合作公告的博文中所述,LangChain 和 MongoDB Atlas 是“天生一对”,更是得到了有机社区的热情响应,进而在 LangChain 中实现了与 MongoDB 的多次集成。除了现在支持 Atlas Vector Search 作为矢量存储之外,还支持将 MongoDB 用作聊天日志历史记录。阅读文档: python 、 javascript 。 4. 使用 MindsDB AI Collections 直接在 MongoDB Atlas 中生成预测 MindsDB 是一个开源机器学习平台,旨在将自动化机器学习引入数据库。在本篇博客中,您将使用 MindsDB AI Collections 直接在 Atlas 中生成预测,以便能够将预测作为常规数据使用、查询这些预测,并通过简化部署工作流程来加快开发速度。 阅读博客 。 5. 使用 Atlas Triggers 将 HuggingFace 转换器模型集成至 MongoDB Atlas HuggingFace 是一个 AI 社区,可以轻松构建、训练和部署机器学习模型。利用 Atlas Triggers 和 HuggingFace,您可以轻松对运营数据的变化做出响应,为您的模型提供长期记忆。了解如何设置触发器来自动预测 MongoDB 数据库中新文档的情感并将其作为附加字段添加到文档中。请参阅 GitHub Repo 。 图 1:示例应用架构显示外部或专有数据如何为 LLM 提供长期记忆,以及数据如何从用户的输入流向 LLM 支持的响应。 使用 MongoDB 构建从原型到生产的生成式 AI 密集型应用程序 MongoDB 基于 Atlas 构建的开发者数据平台提供了现代化、优化的开发者体验,同时也经过了全球数千家企业的实战测试,进而实现规模化和安全性。 无论您是在初创公司还是企业中打造下一个重大项目,Atlas 都能助力您: 加速构建基于真实运营数据的生成式 AI 密集型应用程序。 利用单一平台简化您的应用架构,该平台允许他们将应用和矢量数据存储在同一位置,使用无服务功能对源数据的变化做出响应,并在多个数据模态之间进行搜索,以提高应用生成的响应的相关性和准确性。 借助文档模型的灵活性,轻松改进您的生成式 AI 密集型应用程序,同时保持简洁、优雅的开发者体验。 无缝集成领先的 AI 服务和系统,例如超大规模服务提供商以及开源大型语言模型和框架,以在动态市场中保持竞争力。 在高性能、高度可扩展的操作数据库上构建生成式 AI 密集型应用程序,该数据库已经在各种 AI 使用案例中经过十年的验证。 虽然这些示例是更具创新性的构建基块,MongoDB 仍可以助力您实现从概念到生产再到规模化的转变。立即注册 MongoDB Atlas 的免费套餐,并与您的首选框架和大型语言模型集成。如果您有兴趣与我们更密切地合作,请查看我们的 MongoDB AI 创新者计划 ,该计划致力于为人工智能创新提供支持并展示初创企业、客户和合作伙伴的领先解决方案。

June 22, 2023

혁신적 성장을 지원하는 MongoDB Atlas와 LLM

생성형 AI 기반 애플리케이션에서 고객을 위한 매력적이고 차별화된 경험을 구축하려면 인공 지능의 기반을 진실에 둬야 합니다. 이러한 진실은 데이터, 더 구체적으로 말하면 가장 최신 버전의 운영 데이터에서 비롯됩니다. 고급 시맨틱 검색을 통해 초개인화된 경험을 제공할 때든, 사용자 콘텐츠와 대화를 생성할 때든, MongoDB Atlas는 운영, 분석, 벡터 검색 데이터 서비스를 통합해 LLM과 트랜스포머 모델의 강력한 기능을 앱에 삽입하는 작업을 간소화해줍니다. 개발자들은 매일 획기적이고 혁신적인 차세대 생성형 AI 기반 애플리케이션을 구축합니다. 상업적인 오픈 소스 LLM은 엄청난 속도로 발전하고 있습니다. 이를 기반으로 구축할 수 있는 프레임워크와 도구는 매우 다양하고, 이러한 프레임워크와 도구는 혁신을 민주화합니다. 하지만 개발팀이 반드시 메워야 할 간극이 있습니다. 바로 이러한 애플리케이션을 프로토타입에서 엔터프라이즈급 애플리케이션으로 발전시키는 것입니다. 먼저, 이러한 거대 모델이 액세스할 수 있는 데이터는 최신 정보가 아닙니다. 따라서 모델이 부정확하거나 정보에 기반하지 않은 답변을 제공할 수 있습니다. 답변이 정보에 기반하지 않는 문제를 해결할 수 있는 옵션에는 두 가지가 있습니다. 하나는 거대 모델을 세세하게 조정하는 것이고, 다른 하나는 거대 모델에 장기 메모리를 제공하는 것입니다. 하지만 이러한 옵션을 사용할 경우 두 번째 장벽이 생깁니다. 바로 적절한 보안 제어 기능을 탑재하고 있고 사용자가 기대하는 규모와 성능으로 정보를 학습시킨 LLM을 기반으로 애플리케이션을 배포해야 한다는 것입니다. 경직된 스키마의 방해 없이 거대 모델 학습에 필요한 끊임없이 변화하는 비정형 데이터와 정형 데이터에 적응하려면 개발자에게 데이터 모델 유연성을 갖춘 데이터 플랫폼이 필요합니다. 비록 모델을 세세하게 조정하는 것은 선택 사항이지만, 이 작업은 시간과 컴퓨팅 리소스 측면에서 엄청난 비용을 초래합니다. 즉, 개발자는 거대 모델에 프롬프트의 일부로 문맥을 제공하는 데이터를 제시할 수 있어야 하고, 생성형 모델에 장기 메모리를 제공해야 합니다. 아래에서 다양한 LLM과 생성형 AI 프레임워크를 사용해 이를 가능하게 하는 방법을 살펴보도록 하겠습니다. MongoDB로 AI 기반 앱을 구축하는 방법은 AI 자료 페이지에서 더 자세히 확인할 수 있습니다. MongoDB Atlas와 거대 언어 모델 입문을 위한 5가지 자료 MongoDB Atlas를 사용하면 하이퍼스케일러, 오픈 소스 LLM, 프레임워크 같은 선도적인 생성형 AI 서비스와 시스템을 원활하게 통합할 수 있습니다. 개발자는 Atlas Database 와 Atlas Vector Search (프리뷰)를 통해 문서 저장소와 벡터 임베딩 데이터 저장소를 한 곳에 결합해 운영 데이터의 진실을 기반으로 하는 생성형 AI 기반 애플리케이션 구축을 가속화할 수 있습니다. 아래 예시에서 보편적으로 사용되는 LLM 프레임워크와 MongoDB를 사용해 이를 가능하게 하는 방법을 살펴보겠습니다. 1. Atlas Vector Search(프리뷰)와 시맨틱 검색용 OpenAI 시작하기 이 튜토리얼에는 MongoDB Atlas를 사용해 샘플 영화 데이터 세트에서 시맨틱 검색을 수행하는 단계가 설명되어 있습니다. 먼저, 새 문서가 클러스터에 삽입될 때마다 OpenAI API를 호출해 벡터 임베딩으로 변환하도록 Atlas 트리거를 설정합니다. 그다음, Atlas Vector Search를 사용해 벡터 검색 쿼리를 수행합니다. HuggingFace 모델을 활용하는 방법을 알려주는 특별 보너스 섹션도 마련되어 있습니다. 튜토리얼 살펴보기 2. Llamalndex와 MongoDB를 사용해 독점 데이터로 생성형 AI 기반 채팅 앱 구축하기 LlamaIndex는 LLM을 외부 데이터와 연결할 수 있는 간단하고 유연한 인터페이스를 제공합니다. LlamaIndex와 MongoDB가 함께 운영하는 이 블로그에서는 맞춤형 채팅 앱을 구축해야 하는 이유와 그 방법을 자세히 살펴볼 수 있습니다. 블로그에 첨부된 노트에는 영어 쿼리를 사용해 모든 PDF 문서를 조회하는 방법을 배울 수 있는 코드가 설명되어 있습니다. 블로그 보기 3. Atlas Vector Search(프리뷰)를 LangChain의 벡터 저장소로 사용하는 방법에 관한 문서 파트너십 발표에 관한 블로그 게시물에서 언급한 것처럼 LangChain과 MongoDB Atlas는 서로 잘 어울리는 조합입니다. 커뮤니티에서 유기적으로 발생한 열정이 LangChain에서 여러 가지 MongoDB 통합을 지원하는 것으로 이어졌다는 사실이 이를 증명합니다. MongoDB를 채팅 로그 기록으로 활용하도록 지원하는 기존 통합에 더불어 이제 Atlas Vector Search를 Vector Store로 활용하는 기능도 지원됩니다. 문서 읽기: python , javascript 4. MindsDB AI Collections를 사용해 MongoDB Atlas에서 바로 예측 생성하기 MindsDB는 자동화된 머신 러닝을 데이터베이스에 제공하는 오픈 소스 머신 러닝 플랫폼입니다. 이 블로그에서는 MindsDB AI Collections를 사용해 Atlas에서 바로 예측을 생성하며 예측을 일반 데이터처럼 사용하고, 이러한 예측을 조회하며, 배포 워크플로를 간소화해 개발 속도를 가속화하는 역량을 키울 수 있습니다. 블로그 보기 5. Atlas 트리거를 사용해 HuggingFace 트랜스포머 모델을 MongoDB Atlas에 통합하기 HuggingFace는 머신 러닝 모델을 간편하게 구축하고, 학습시키고, 배포할 수 있는 AI 커뮤니티입니다. HuggingFace와 Atlas 트리거를 함께 사용하면 모델에 장기 메모리를 제공하는 운영 데이터의 변경 사항에도 쉽게 대응할 수 있습니다. MongoDB 데이터베이스에 저장된 새 문서의 분위기를 자동으로 예측하고 문서에 추가 필드로 추가하도록 트리거를 설정하는 방법을 살펴보세요. GitHub 리포지토리 보기 그림 1: 외부 데이터 또는 독점 데이터로 LLM에 장기 메모리를 제공하는 방법과 사용자가 입력한 질문에서부터 LLM 기반 응답까지의 데이터 흐름을 보여주는 샘플 앱 아키텍처 생성형 AI 기반 앱의 프로토타입에서부터 프로덕션까지, MongoDB와 함께 Atlas를 기반으로 구축된 MongoDB의 개발자 데이터 플랫폼은 현대적이고 최적화된 개발자 경험을 제공하는 동시에 전 세계 수천 개의 엔터프라이즈에서 확장 가능한 안전한 성능을 발휘할 수 있도록 철저한 테스트를 거쳤습니다. Atlas는 스타트업에서부터 대기업까지 차세대 혁신을 구축 중인 기업에 다음과 같은 이점을 제공합니다. 실제 운영 데이터를 기반으로 하는 생성형 AI 기반 애플리케이션을 빠르게 구축할 수 있습니다. 앱과 벡터 데이터를 한 공간에 저장하고, 서버리스 함수를 사용해 소스 데이터의 변경 사항에 대응하고, 모든 데이터 형식에서 검색을 실행해 앱이 생성하는 응답의 관련성과 정확성을 개선하도록 지원하는 단일 플랫폼을 활용해 앱 아키텍처를 간소화할 수 있습니다. 문서 모델의 유연성을 활용해 차세대 생성형 AI 기반 앱을 간편하게 개발하는 동시에 단순하고 세련된 개발자 경험을 유지할 수 있습니다. 하이퍼스케일러, 오픈 소스 LLM, 프레임워크 등의 선도적인 AI 서비스와 시스템을 원활하게 통합해 역동적인 시장에서 경쟁력을 유지할 수 있습니다. 지난 10년간 다양한 AI 사용 사례를 통해 검증된 확장성이 뛰어난 고성능 운영 데이터베이스에서 생성형 AI 기반 애플리케이션을 구축할 수 있습니다. 이러한 예시는 더 혁신적인 앱을 개발하는 데 필요한 요소로, MongoDB는 콘셉트 구상에서 프로덕션, 확장에 이르기까지 모든 단계를 지원합니다. 지금 바로 MongoDB Atlas 무료 티어에 가입해 원하는 프레임워크와 LLM을 통합하세요. MongoDB와 더 긴밀하게 협력하고 싶다면 인공지능 혁신을 지원하고 스타트업, 고객, 파트너의 최첨단 솔루션을 소개하는 MongoDB AI 이노베이터 프로그램을 살펴보세요.

June 22, 2023

Da 0 a 1 al livello aziendale con MongoDB Atlas e gli LLM

Creare esperienze avvincenti e veramente differenziate per i clienti grazie ad applicazioni di IA generativa arricchite significa basare l'intelligenza artificiale su informazioni affidabili. Questa verità deriva dai tuoi dati e, nello specifico, dai tuoi dati operativi più aggiornati. Che tu stia fornendo esperienze iper-personalizzate con ricerca semantica avanzata o producendo contenuti e conversazioni guidati dai prompt degli utenti, MongoDB Atlas unifica servizi di dati operativi, di analisi e di ricerca vettoriale per semplificare l'integrazione della potenza degli LLM e dei modelli di trasformazione nelle tue app. Ogni giorno, gli sviluppatori creano una nuova applicazione rivoluzionaria e trasformativa basata sull'IA generativa, gli LLM commerciali e open source avanzano a una velocità vertiginosa e i framework e gli strumenti per costruire attorno ad essi aumentano e democratizzano l’innovazione. Eppure, portare queste applicazioni dal prototipo al livello aziendale è un divario che i team di sviluppo devono superare. Innanzitutto, questi modelli di grandi dimensioni possono fornire risposte errate o non informate, perché i dati a cui hanno accesso sono obsoleti. Esistono due opzioni per risolvere la comparsa di risposte non informate: mettere a punto un modello di grandi dimensioni o fornirgli una memoria a lungo termine. Tuttavia, questo comporta un secondo ostacolo: l'implementazione di un'applicazione attorno a un LLM informato, con i giusti controlli di sicurezza e con la scala e le prestazioni che gli utenti si aspettano. Gli sviluppatori hanno bisogno di una piattaforma dati che disponga della flessibilità del modello di dati per adattarsi alla continua evoluzione dei dati strutturati e non che informano i modelli di grandi dimensioni, senza l'ostacolo di schemi rigidi. Sebbene la messa a punto di un modello sia un'opzione, è proibitiva sia in termini di tempo che risorse computazionali. Ciò significa che gli sviluppatori devono essere in grado di presentare i dati come contesto a modelli di grandi dimensioni come parte dei prompt e dare a questi modelli generativi una memoria a lungo termine. Di seguito, analizzeremo alcuni esempi di come riuscirci con vari LLM e framework di IA generativa. Consulta la nostra pagina delle risorse sull'intelligenza artificiale per saperne di più sulla creazione di app basate sull'IA con MongoDB. Cinque risorse per iniziare con MongoDB Atlas e gli LLM MongoDB Atlas semplifica l'integrazione dei principali servizi e sistemi di IA generativa, come gli hyperscaler e i framework e LLM open source. Combinando archivi di dati con incorporamento di documenti e vettori in un unico posto tramite Atlas Database e Atlas Vector Search (anteprima), gli sviluppatori possono accelerare la creazione delle loro applicazioni arricchite dall'IA generativa basate sulle informazioni affidabili dei dati operativi. Ecco alcuni esempi su come lavorare con i più framework LLM più diffusi e MongoDB: 1. Inizia con Atlas Vector Search (anteprima) e OpenAI per la ricerca semantica Questo tutorial illustra le fasi di esecuzione della ricerca semantica su un set di dati di esempio sui film con MongoDB Atlas. Innanzitutto, configura un Atlas Trigger per effettuare una chiamata all'API OpenAI ogni volta che un nuovo documento viene inserito nel tuo cluster, per trasformarlo in un incorporamento vettoriale. Quindi, esegui una query di ricerca vettoriale utilizzando Atlas Vector Search. C'è anche una sezione bonus speciale per sfruttare i modelli HuggingFace. Leggi il tutorial . 2. Crea un'app di chat arricchita con IA generativa con i tuoi dati proprietari utilizzando Llamalndex e MongoDB LlamaIndex fornisce un'interfaccia semplice e flessibile per collegare gli LLM con dati esterni. Questo blog congiunto di LlamaIndex e MongoDB approfondisce i motivi e le modalità con cui creare la tua app di chat. Il file di note allegato al blog fornisce una procedura dettagliata sul codice che spiega come eseguire le query su qualsiasi documento PDF utilizzando query in lingua inglese. Leggi il blog . 3. Vedi i documenti su come utilizzare Atlas Vector Search (anteprima) come archivio di vettori con LangChain Come si legge nel post di annuncio della partnership, LangChain e MongoDB Atlas sono un binomio naturale, dimostrato anche dall'entusiasmo unanime della comunità che ha portato a diverse integrazioni di LangChain per MongoDB. Oltre a supportare Atlas Vector Search come archivio di vettori, è già possibile utilizzare MongoDB come cronologia dei log di chat. Leggi i documenti: python , javascript . 4. Genera previsioni direttamente in MongoDB Atlas con MindsDB AI Collections MindsDB è una piattaforma di machine learning open source che porta il machine learning automatico nel database. In questo blog genererai previsioni direttamente in Atlas con MindSDB AI Collections, per utilizzare le previsioni come dati regolari, interrogare queste previsioni e accelerare la velocità di sviluppo semplificando i flussi di lavoro di implementazione. Leggi il blog . 5. Integra i modelli di trasformazione di HuggingFace in MongoDB Atlas con Atlas Triggers HuggingFace è una community di IA che semplifica la creazione, l'addestramento e l'implementazione di modelli di machine learning. L'utilizzo di Atlas Triggers insieme a HuggingFace permette di reagire facilmente ai cambiamenti nei dati operativi che creano la memoria a lungo termine dei tuoi modelli. Scopri come configurare le attivazioni per prevedere automaticamente il sentiment dei nuovi documenti nel database MongoDB e aggiungerle come campi aggiuntivi nei documenti. Vedi il repository GitHub . Figura 1: L'architettura dell'app di esempio mostra in che modo i dati, esterni o proprietari, forniscono memoria a lungo termine a un LLM e come i dati fluiscono dall'input di un utente a una risposta basata su LLM. Dal prototipo alla produzione con MongoDB, per app arricchite con IA generativa La piattaforma dati per sviluppatori di MongoDB, basata su Atlas, offre un'esperienza moderna e ottimizzata agli sviluppatori, ed è stata testata da migliaia di aziende in tutto il mondo per garantire prestazioni sicure e su larga scala. Se stai per fare il prossimo grande passo in una startup o in un'azienda, Atlas ti consente di: Accelera la creazione delle tue applicazioni arricchite dall'IA generativa basate sulle informazioni affidabili dei dati operativi. Semplifica l'architettura delle tue app sfruttando un'unica piattaforma che consente di archiviare app e dati vettoriali nello stesso posto, reagire alle modifiche dei dati di origine con funzioni serverless e cercare tra più modalità di dati per migliorare la pertinenza e l'accuratezza nelle risposte generate. Evolvi facilmente le tue app arricchite dall'IA generativa con la flessibilità del modello di documento, mantenendo un'esperienza di sviluppo semplice ed elegante. Integra perfettamente i principali servizi e sistemi di IA, come hyperscaler, LLM e framework open source, per rimanere competitivo nei mercati dinamici. Costruisci applicazioni arricchite dall'IA generativa su un database operativo ad alte prestazioni e altamente scalabile con dieci anni di convalida su un'ampia gamma di casi d'uso dell'IA. Sebbene questi esempi siano solo gli elementi di base di qualcosa di più innovativo, MongoDB può aiutarti a passare dall'ideazione alla produzione fino alla scalabilità. Inizia subito iscrivendoti al livello gratuito di MongoDB Atlas e integrandolo con i tuoi framework e LLM preferiti. Se sei interessato a lavorare con noi più da vicino, dai un'occhiata al nostro programma MongoDB AI Innovators , che abilita l'innovazione dell'intelligenza artificiale e mette in mostra soluzioni di startup, clienti e partner all'avanguardia.

June 22, 2023

Passez de 0 à 1 à l'état de préparation de l'entreprise avec MongoDB Atlas et les grands modèles de langage (LLM)

Pour créer des expériences convaincantes et véritablement différenciées pour vos clients à partir d'applications génératives enrichies par l'IA, vous devez ancrer l'intelligence artificielle sur la vérité. Cette vérité provient de vos données, plus précisément, de vos données opérationnelles les plus récentes. Que vous fournissiez des expériences hyper-personnalisées avec une recherche sémantique avancée ou que vous produisiez du contenu et des conversations guidés par l'utilisateur, MongoDB Atlas unifie les services de données opérationnels, analytiques et de recherche vectorielle pour rationaliser l'intégration de la puissance des LLM et des modèles de transformateurs dans vos applications. Chaque jour, des développeurs créent la prochaine application révolutionnaire basée sur l’IA générative. Les LLM commerciaux et open source évoluent très rapidement. Les frameworks et les outils qui permettent de les développer sont nombreux et démocratisent l'innovation. Pourtant, faire passer ces applications du stade de prototype à celui de solution d'entreprise représente un défi pour les équipes de développement. Pour commencer, ces modèles volumineux peuvent fournir des réponses erronées ou non pertinentes, car les données auxquelles ils ont accès sont obsolètes. Deux options s'offrent à vous pour résoudre ce dernier problème : affiner un grand modèle ou le doter d'une mémoire à long terme. Cependant, cette solution entraîne une deuxième difficulté : le déploiement d'une application sur un LLM pertinent avec les contrôles de sécurité adéquats, l'évolutivité et les performances attendues par les utilisateurs. Les développeurs ont besoin d'une plateforme de données qui offre la flexibilité nécessaire pour s'adapter à l'évolution constante des données structurées et non structurées qui alimentent les grands modèles sans être entravés par des schémas rigides. Bien qu'il soit possible d'affiner un modèle, cela représente un coût prohibitif en termes de temps et de ressources informatiques. Cela signifie que les développeurs doivent être en mesure de présenter des données sous forme de contexte pour les grands modèles dans le cadre d'invites. Ils doivent doter des modèles génératifs d'une mémoire à long terme. Voici quelques exemples de la manière de procéder avec divers LLM et frameworks d'IA générative. Consultez notre page de ressources sur l'IA pour en savoir plus sur la création d'applications alimentées par l'IA avec MongoDB. Cinq ressources pour démarrer avec MongoDB Atlas et les grands modèles de langage MongoDB Atlas facilite l'intégration des principaux services et systèmes d’IA générative tels que les hyperscalers et les LLM et frameworks open source. En combinant les dépôts de données des vector embeddings et des documents et en un seul endroit via Atlas Database et Atlas Vector Search (aperçu), les développeurs peuvent accélérer la création de leurs applications génératives enrichies par l’IA fondées sur la vérité des données opérationnelles. Voici quelques exemples d'utilisation avec les frameworks LLM les plus populaires et MongoDB : 1. Démarrer avec Atlas Vector Search (aperçu) et OpenAI pour la recherche sémantique Ce tutoriel vous guide tout au long des étapes d’exécution d’une recherche sémantique sur un échantillon de données de films avec MongoDB Atlas. Vous commencerez par configurer un déclencheur Atlas pour appeler une API OpenAI chaque fois qu’un nouveau document est inséré dans votre cluster, afin de le convertir en vector embedding. Vous allez ensuite effectuer une requête de recherche vectorielle à l'aide d'Atlas Vector Search. Il y a même une section bonus qui vous explique comment exploiter les modèles HuggingFace. Regarder le tutoriel 2. Créer une application de chat enrichie par l'IA générative avec vos données propriétaires en utilisant Llamalndex et MongoDB LlamaIndex fournit une interface simple et flexible pour connecter les LLM avec des données externes. Cet article rédigé conjointement par LlamaIndex et MongoDB explique plus en détail pourquoi et comment vous pourriez vouloir créer votre propre application de chat. Le carnet de notes annexé fournit une description de code permettant d'interroger n'importe quel document PDF à l'aide de requêtes en anglais. Lire l'article 3. Consulter la documentation sur l'utilisation d'Atlas Vector Search (aperçu) en tant que vector store avec LangChain Comme indiqué dans le billet de blog annonçant le partenariat, LangChain et MongoDB Atlas s'accordent parfaitement, comme en témoigne l'enthousiasme de la communauté qui a conduit à plusieurs intégrations dans LangChain pour MongoDB. Outre la prise en charge d'Atlas Vector Search en tant que vector store, MongoDB prend déjà en charge l'historique des journaux de chat. Consulter les documents : python , javascript 4. Générer des prédictions directement dans MongoDB Atlas avec les collections d'IA MindsDB MindsDB est une plateforme open source qui intègre le machine learning à la base de données. Cet article explique comment générer des prédictions directement dans Atlas avec les collections d'IA MindsDB. Vous pouvez ainsi utiliser ces prédictions comme des données régulières, les interroger et accélérer le développement en simplifiant les flux de travail de déploiement. Lire l'article 5. Intégrer les modèles de transformateurs HuggingFace dans MongoDB Atlas avec Atlas Triggers HuggingFace est une communauté d’IA qui facilite la création, l’entraînement et le déploiement de modèles de machine learning. L’utilisation d’Atlas Triggers et de HuggingFace vous permet de réagir facilement aux changements dans les données opérationnelles qui fournissent une mémoire à long terme à vos modèles. Découvrez comment configurer des déclencheurs pour prédire automatiquement le sentiment des nouveaux documents dans votre base de données MongoDB et les ajouter en tant que champs supplémentaires à vos documents. Consulter le référentiel GitHub Schéma n° 1 : l'exemple d'architecture d'application montre comment des données externes ou propriétaires fournissent une mémoire à long terme à un LLM et comment elles circulent de l'entrée d'un utilisateur à une réponse alimentée par le LLM. Du prototype à la production avec MongoDB pour des applications génératives enrichies par l'IA La developer data platform MongoDB basée sur Atlas offre une expérience de développement moderne et optimisée. Elle est testée par des milliers d'entreprises dans le monde entier pour assurer son évolutivité et sa sécurité. Que vous meniez un projet pour une start-up ou une entreprise, Atlas vous permet de faire ce qui suit : Accélérer la création de vos applications génératives enrichies par l’IA et fondées sur la vérité des données opérationnelles. Simplifier l'architecture de vos applications en tirant parti d'une plateforme unique qui leur permet de stocker les applications et les données vectorielles en un seul endroit, de réagir aux changements dans les données sources avec des fonctions serverless et de rechercher parmi plusieurs modalités de données pour améliorer la pertinence et la précision des réponses générées par leurs applications. Faire évoluer facilement vos applications enrichies par l'IA grâce à la flexibilité du document model, tout en conservant une expérience de développement simple et élégante. Intégrer facilement les principaux services et systèmes d'IA tels que les hyperscalers et les LLM et frameworks open source afin de rester compétitif sur des marchés en perpétuelle évolution. Créer des applications génériques enrichies par l'IA sur une base de données opérationnelle hautement performante et évolutive, validée depuis une dizaine d'années pour de nombreux cas d'utilisation de l'IA. Bien que ces exemples constituent les prémices de projets encore plus innovants, MongoDB peut vous aider à passer du concept à la production puis à l'échelle. Commencez dès aujourd'hui en vous inscrivant à la version gratuite de MongoDB Atlas et en l'intégrant à vos frameworks et LLM préférés. Si vous souhaitez approfondir votre collaboration avec nous, consultez notre programme MongoDB AI Innovators , qui encourage l'innovation dans le secteur de l'intelligence artificielle et présente des solutions de pointe proposées par des start-ups, des clients et des partenaires.

June 22, 2023

Mit MongoDB Atlas und LLMs zu Lösungen, die für Unternehmen geeignet sind

Wenn Sie mit generativen, mit KI unterstützten Anwendungen überzeugende, wirklich differenzierte Erlebnisse für Ihre Kunden schaffen wollen, muss die künstliche Intelligenz auf der Wahrheit beruhen. Diese Wahrheit basiert auf Ihren Daten, genauer gesagt, auf Ihren aktuellsten operativen Daten. Ganz gleich, ob Sie hyperpersonalisierte Erlebnisse mit der erweiterten semantischen Suche anbieten oder benutzergesteuerte Inhalte und Konversationen produzieren, MongoDB Atlas vereint operative, analytische und Vektorsuchdatendienste, um die Einbettung der Leistungsfähigkeit von LLMs und Transformer-Modellen in Ihre Anwendungen zu optimieren. Jeden Tag erstellen Entwickler die nächste bahnbrechende, transformative, generative KI-gestützte Anwendung. Kommerzielle und Open-Source-LLMs entwickeln sich in rasantem Tempo. Es gibt zahlreiche Frameworks und Tools, mit denen man darauf aufbauen und Innovationen demokratisieren kann. Doch der Weg vom Prototyp zur Unternehmensreife dieser Anwendungen ist die Kluft, die Entwicklungsteams überwinden müssen. Erstens können diese großen Modelle falsche oder uninformierte Antworten liefern, weil die Daten, auf die sie Zugriff haben, veraltet sind. Es gibt zwei Möglichkeiten, uninformierte Antworten zu klären – die Feinabstimmung eines großen Modells oder die Bereitstellung eines Langzeitgedächtnisses. Dies bringt jedoch eine zweite Hürde mit sich – die Bereitstellung einer Anwendung um ein informiertes LLM herum mit den richtigen Sicherheitskontrollen und in dem Umfang und der Leistung, die die Benutzer erwarten. Entwickler benötigen eine Datenplattform, die über die Flexibilität des Datenmodells verfügt, um sich an die sich ständig ändernden unstrukturierten und strukturierten Daten anzupassen, die in große Modelle einfließen, ohne durch starre Schemata behindert zu werden. Die Feinabstimmung eines Modells ist zwar eine Option, aber in Bezug auf Zeit und Rechenressourcen eine kostspielige Angelegenheit. Dies bedeutet, dass Entwickler in der Lage sein müssen, Daten im Rahmen von Eingabeaufforderungen als Kontext für große Modelle darzustellen. Sie müssen diesen generativen Modellen ein Langzeitgedächtnis geben. Im Folgenden finden Sie einige Beispiele dafür, wie dies mit verschiedenen LLMs und generativen KI-Frameworks erreicht werden kann. Auf unserer KI-Ressourcenseite erfahren Sie mehr über die Entwicklung von KI-gestützten Apps mit MongoDB. Fünf Ressourcen für die ersten Schritte mit MongoDB Atlas und Large Language Models MongoDB Atlas ermöglicht die nahtlose Integration führender generativer KI-Services und -Systeme wie die Hyperscaler und Open Source LLMs und Frameworks. Durch die Kombination von Dokumenten- und Vektoreinbettungsdatenspeichern an einem Ort über Atlas Database und Atlas Vector Search (Vorschau) können Entwickler die Erstellung ihrer generativen, mit KI angereicherten Anwendungen beschleunigen, die auf den tatsächlichen Betriebsdaten beruhen. Im Folgenden finden Sie Beispiele für die Arbeit mit gängigen LLM-Frameworks und MongoDB: 1. Starten Sie mit Atlas Vector Search (Vorschau) und OpenAI für die semantische Suche Dieses Tutorial führt Sie durch die Schritte der semantischen Suche in einem Beispiel-Filmdatensatz mit MongoDB Atlas. Zunächst richten Sie einen Atlas-Trigger ein, der eine OpenAI-API aufruft, sobald ein neues Dokument in Ihren Cluster eingefügt wird, um es in eine Vektoreinbettung umzuwandeln. Dann führen Sie eine Vektorsuchanfrage mit Atlas Vector Search durch. Es gibt sogar einen speziellen Bonusbereich für die Nutzung von HuggingFace-Modellen. Lesen Sie das Tutorial . 2. Erstellen Sie mit Llamalndex und MongoDB eine mit KI angereicherte Chat-App mit Ihren eigenen Daten LlamaIndex bietet eine einfache, flexible Schnittstelle, um LLMs mit externen Daten zu verbinden. In diesem gemeinsamen Blog von LlamaIndex und MongoDB erfahren Sie mehr darüber, warum Sie Ihre eigene Chat-App erstellen sollten und wie. Das beigefügte Notizbuch im Blog enthält eine Code-Anleitung, wie Sie jedes PDF-Dokument mit englischsprachigen Abfragen abrufen können. Lesen Sie den Blog . 3. In der Dokumentation erfahren Sie, wie Sie Atlas Vector Search (Vorschau) als Vektorspeicher mit LangChain verwenden können Wie im Blogbeitrag zur Ankündigung der Partnerschaft erwähnt, passen LangChain und MongoDB Atlas auf natürliche Weise zusammen. Das hat die Begeisterung der Community gezeigt, die zu mehreren Integrationen in LangChain für MongoDB geführt hat. Zusätzlich zur Unterstützung von Atlas Vector Search als Vektorspeicher gibt es bereits Unterstützung für die Nutzung von MongoDB als Chat-Protokollverlauf. Lesen Sie die Dokumentation: Python , JavaScript . 4. Generieren Sie Vorhersagen direkt in MongoDB Atlas mit MindsDB AI Collections MindsDB ist eine Open-Source-Plattform für maschinelles Lernen, die automatisiertes maschinelles Lernen in die Datenbank bringt. In diesem Blog erfahren Sie, wie Sie mit MindsDB AI Collections direkt in Atlas Vorhersagen generieren können. Damit haben Sie die Möglichkeit, Vorhersagen als reguläre Daten zu nutzen, diese Vorhersagen abzufragen und die Entwicklungsgeschwindigkeit durch Vereinfachung der Bereitstellungsabläufe zu erhöhen. Lesen Sie den Blog . 5. Integrieren Sie HuggingFace-Transformatormodelle in MongoDB Atlas mit Atlas Triggers HuggingFace ist eine KI-Community, die es einfach macht, Modelle für maschinelles Lernen zu erstellen, zu trainieren und einzusetzen. Durch den Einsatz von Atlas Triggers in Verbindung mit HuggingFace können Sie problemlos auf Änderungen der Betriebsdaten reagieren, die Ihren Modellen ein Langzeitgedächtnis verleihen. Lernen Sie, wie Sie Trigger einrichten, um automatisch die Stimmung neuer Dokumente in Ihrer MongoDB-Datenbank vorherzusagen und sie als zusätzliche Felder zu Ihren Dokumenten hinzuzufügen. Sehen Sie sich das GitHub-Repository an. Abbildung 1: Die Architektur der Beispielanwendung zeigt, wie externe oder proprietäre Daten einem LLM Langzeitspeicher zur Verfügung stellen und wie die Daten von der Eingabe eines Benutzers zu einer LLM-gestützten Antwort weitergeleitet werden. Vom Prototyp zur Produktion mit MongoDB für mit generativer KI erweiterte Anwendungen Die auf Atlas aufbauende Entwicklerdatenplattform von MongoDB bietet ein modernes, optimiertes Entwicklererlebnis und wurde von Tausenden von Unternehmen auf der ganzen Welt im Hinblick auf Skalierbarkeit und Sicherheit getestet. Ganz gleich, ob Sie in einem Startup oder in einem Unternehmen das nächste große Ding entwickeln, Atlas ermöglicht Ihnen: Beschleunigung der Entwicklung Ihrer mit generativer KI erweiterten Anwendungen, die auf tatsächlichen Betriebsdaten beruhen. Vereinfachung Ihrer App-Architektur durch Nutzung einer zentralen Plattform, die es ihnen ermöglicht, App- und Vektordaten am selben Ort zu speichern, mit serverlosen Funktionen auf Änderungen in den Quelldaten zu reagieren und über mehrere Datenmodalitäten hinweg zu suchen, um die Relevanz und Genauigkeit der von ihren Apps generierten Antworten zu verbessern. Weiterentwickelung Ihrer mit KI erweiterten Apps mit der Flexibilität des Dokumentenmodells unter Beibehaltung einer einfachen, eleganten Entwicklererfahrung. Nahtlose Integration führender KI-Services und -Systeme wie die Hyperscaler und Open Source LLMs und Frameworks, um in dynamischen Märkten wettbewerbsfähig zu bleiben. Entwicklung von mit KI erweiterten Anwendungen auf einer leistungsstarken, hoch skalierbaren operativen Datenbank, die seit einem Jahrzehnt für eine Vielzahl von KI-Anwendungsfällen validiert wurde. Während diese Beispiele die Bausteine für etwas Innovativeres sind, kann MongoDB Ihnen helfen, vom Konzept zur Produktion zu gelangen und zu skalieren. Legen Sie noch heute los, indem Sie sich für das kostenlose MongoDB Atlas -Angebot anmelden und die Integration mit Ihren bevorzugten Frameworks und LLMs vornehmen. Wenn Sie daran interessiert sind, enger mit uns zusammenzuarbeiten, werfen Sie einen Blick auf unser MongoDB AI Innovators-Programm , das Innovationen im Bereich der künstlichen Intelligenz fördert und innovative Lösungen von Startups, Kunden und Partnern präsentiert.

June 22, 2023

Go from 0 to 1 to Enterprise-Ready with MongoDB Atlas and LLMs

This post is also available in: Deutsch , Français , Español , Português , Italiano , 한국어 , 简体中文 . Creating compelling, truly differentiated experiences for your customers from generative AI-enriched applications means grounding artificial intelligence in truth. That truth comes from your data, more specifically, your most up-to-date operational data. Whether you’re providing hyper-personalized experiences with advanced semantic search or producing user-prompted content and conversations, MongoDB Atlas unifies operational, analytical and vector search data services to streamline embedding the power of LLMs and transformer models into your apps. Everyday, developers are building the next groundbreaking, transformative generative AI powered application. Commercial and open source LLMs are advancing at breakneck speed. The frameworks and tools to build around them are plentiful and democratize innovation. And yet taking these applications from prototype to enterprise-ready is the chasm development teams must cross. First, these large models can provide incorrect or uninformed answers, because the data they have access to is dated. There are two options to solve uninformed answers - fine-tuning a large model or providing it with long-term memory. However, doing so begets a second barrier - deploying an application around an informed LLM with the right security controls in place, and at the scale and performance users expect. Developers need a data platform that has the data model flexibility to adapt to the constantly changing unstructured and structured data that informs large models without the hindrance of rigid schemas. While fine-tuning a model is an option, it’s a cost-prohibitive one in terms of time and computational resources. This means developers need to be able present data as context to large models as part of prompts. They need to give these generative models long-term memory. We discuss a few examples of how to do so with various LLMs and generative AI frameworks below. Check out our AI resource page to learn more about building AI-powered apps with MongoDB. Five resources to get started with MongoDB Atlas and Large Language Models MongoDB Atlas makes it seamless to integrate leading generative AI services and systems such as the hyperscalers and open source LLMs and frameworks. By combining document and vector embedding data stores in one place via Atlas Database and Atlas Vector Search (preview), developers can accelerate building their generative AI-enriched applications that are grounded in the truth of operational data. Below are examples with how to work with popular LLM frameworks and MongoDB: 1. Get started with Atlas Vector Search (preview) and OpenAI for semantic search This tutorial walks you through the steps of performing semantic search on a sample movie dataset with MongoDB Atlas. First, you’ll set up an Atlas Trigger to make a call to an OpenAI API whenever a new document is inserted into your cluster, so as to convert it into a vector embedding. Then, you’ll perform a vector search query using Atlas Vector Search. There’s even a special bonus section for leveraging HuggingFace models. Read the tutorial . 2. Build a Gen AI-enriched chat app with your proprietary data using Llamalndex and MongoDB LlamaIndex provides a simple, flexible interface to connect LLMs with external data. This joint blog from LlamaIndex and MongoDB goes into more detail about why and how you might want to build your own chat app. The attached notebook in the blog provides a code walkthrough on how to query any PDF document using English language queries. Read the blog . 3. See the docs for how to use Atlas Vector Search (preview) as a vector store with LangChain As stated in the partnership announcement blog post, LangChain and MongoDB Atlas are a natural fit, and it’s been demonstrated by the organic community enthusiasm which has led to several integrations in LangChain for MongoDB. In addition to now supporting Atlas Vector Search as a Vector Store there is already support to utilize MongoDB as a chat log history. Read the docs: python , javascript . 4. Generate predictions directly in MongoDB Atlas with MindsDB AI Collections MindsDB is an open-source machine learning platform that brings automated machine learning to the database. In this blog you’ll generate predictions directly in Atlas with MindsDB AI Collections, giving you the ability to consume predictions as regular data, query these predictions, and accelerate development speed by simplifying deployment work-flows. Read the blog . 5. Integrate HuggingFace transformer models into MongoDB Atlas with Atlas Triggers HuggingFace is an AI community that makes it easy to build, train and deploy machine learning models. Leveraging Atlas Triggers alongside HuggingFace allows you to easily react to changes in operational data that provides long-term memory to your models. Learn how to set up Triggers to automatically predict the sentiment of new documents in your MongoDB database and add them as additional fields to your documents. See the GitHub Repo . Figure 1: The sample app architecture shows how external, or proprietary, data provides long-term memory to an LLM and how the data flows from a user's input to an LLM-powered response. From prototype to production with MongoDB for generative AI-enriched apps MongoDB’s developer data platform built on Atlas provides a modern, optimized developer experience while also being battle tested by thousands of enterprises globally to perform at scale and securely. Whether you are building the next big thing at a startup or enterprise, Atlas enables you to: Accelerate building your generative AI-enriched applications that are grounded in the truth of operational data. Simplify your app architecture by leveraging a single platform that allows them to store app and vector data in the same place, react to changes in source data with serverless functions, and search across multiple data modalities for improving relevance and accuracy in responses that their apps generate. Easily evolve your gen AI-enriched apps with the flexibility of the document model while maintaining a simple, elegant developer experience. Seamlessly integrate leading AI services and systems such as the hyperscalers and open source LLMs and frameworks to stay competitive in dynamic markets. Build gen AI-enriched applications on a high performance, highly scalable operational database that's had a decade of validation over a wide variety of AI use cases. While these examples are the building blocks for something more innovative, MongoDB can help you go from concept to production to scale. Get started today by signing up for MongoDB Atlas free tier and integrating with your preferred frameworks and LLMs. If you’re interested in working with us more closely, check out our MongoDB AI Innovators program , which enables Artificial Intelligence innovation and showcases cutting-edge solutions from startups, customers, and partners.

June 22, 2023

Visualize Blended Atlas and AWS S3 Data From Atlas Data Lake with MongoDB Charts

As of June 2022, the functionality previously known as Atlas Data Lake is now named Atlas Data Federation. Atlas Data Federation’s functionality is unchanged and you can learn more about it here . Atlas Data Lake will remain in the Atlas Platform, with newly introduced functionality that you can learn about here . We’re excited to announce that MongoDB Charts supports Atlas Data Lake as a data source! You can now use Charts to easily visualize data stored across different Atlas databases and AWS S3 buckets. Thanks to the aggregating power of Atlas Data Lake’s federated query, creating charts and graphs from blended application and cloud object data is simpler than ever before. On the surface this powerful integration is as simple as adding your Atlas Data Lake as a data source within Charts. However, it unlocks a deeper level of analysis while eliminating the need for creating an Extract-Transform-Load (ETL) process across your Atlas and S3 data. The integration provides the ability to visualize data from the following combination of sources without writing any code: Data from many Atlas databases or clusters, including multi-cloud clusters Cloud storage data from AWS S3 Blended Atlas and cloud storage (AWS S3) data Scenario: Finding insights from aggregated customer profile and contract data Let’s add a real world scenario of how this can enhance the analytics you derive from your data. While doing so, we will walk through the steps of setting up your Atlas Data Lake, adding it as a data source to Charts, and getting the most of your data with Charts’ powerful visualization capabilities. For context, let’s imagine we’re an analyst at a telecom company and we have contract data that is stored in MongoDB Atlas in different clusters and databases for each country we operate in - United States and Canada. Second, we have offloaded data from our Customer Relationship Management (CRM) tool as a parquet file into an AWS S3 bucket. All three datasets share a common “customerID” field. Configure Atlas Data Lake Because both “contracts” collections (or datasets) in MongoDB Atlas share the same fields, I simply mapped both into a single collection within the data lake. I mapped the customer profiles dataset into its own collection, since it only shares the “customerID” field. However, now that it’s in the same data lake, I will easily be able to join it to my contract data with a $lookup in my Charts aggregation pipeline or with a Lookup Field in the chart builder. (A $lookup in the MongoDB Query API is equivalent to a join in SQL.) Configure Charts data source I want to find insights from all contracts, both US and Canada in this scenario. Once I have created a single Atlas Data Lake collection (DL_contracts.allcontracts) from the two separate databases, I then need to add it as a data source in Charts. Simply click on “add data source” within Charts and add your data lake, and then choose the collections we want to use in the next step. For completeness I also added the two Atlas collections (US and Canada contracts) as data sources in Charts by following the same steps. Visualize data across multiple Atlas databases With Atlas Data Lake’s federated query capability, which effectively performs a union of data, I am able to build a column chart that shows the amount of all US and CA contracts in a single chart without writing any code. As you can see below, the chart shows both US and CA columns when connected to the data lake collection. When the data source is switched directly to either Atlas database, it only shows data for that respective database, or country in this example. Visualize blended data from Atlas and an AWS S3 bucket Lastly, let’s take our insights to the next level by visualizing data from multiple Atlas databases and a parquet file that’s stored in an AWS S3 bucket. Adding customer profile data that I offloaded from my CRM tool into S3 will enable me to find more robust insights. I could also visualize the data from the parquet file alone by connecting to that data lake collection. Since the contract data and customer profile data are in different collections within my Atlas Data Lake, I created a $lookup in the aggregation pipeline of the Charts data source. I then created a table chart from three different data sources with conditional formatting to quickly identify high value customers. The columns with blue boxes include contract data from both Atlas clusters, while the columns with orange boxes include customer profile data from a parquet file via AWS S3 bucket. Note, I could also aggregate the data in Atlas Data Lake and use $out to create a new collection of the data , and then connect Charts to the new collection as a data source. For the purposes of this blog, I wanted to highlight Charts-specific aggregation capabilities. We hope that you’re excited about the ability to easily visualize multiple data sources, from multiple Atlas databases to AWS S3 buckets in one place! Remember, if you haven’t used Charts before, you can get started for free by signing up for MongoDB Cloud , deploying an Atlas cluster and activating Charts. Try MongoDB Atlas for free today!

July 9, 2021

Dive Deeper into Chart Data with New Drill-Down Capability

With the latest release of MongoDB Charts, you’re now able to dive deeper into the data that’s aggregated in your visualizations. At a high level, we generally create charts, graphs and visualizations of our data to answer questions about our business or products. Oftentimes, we need to “double click” on those visualizations to get insight into each individual data point that makes up the line, bar, column, etc. How the drill-down functionality works: Step 1: Right click on the data point you are interested in drilling down into Step 2: Click "show data for this item" Step 3: View the data in tabular or document format Each view can be better for different circumstances. For data without too many fields or no nested arrays, it might be quicker and more easily viewed in a table. On the other hand, the JSON view allows you to explore the structure of documents and click into arrays. Scenarios where more detailed information can help: Data visualization use cases are relatively broad spanning, but oftentimes they fall into 3 main categories: monitoring data, finding insights, and embedding analytics into applications. I’ll be focusing on the first two of these three as there are many different ways you could potentially build drilling-down into data via embedded charts. (Read more about our click events and embedded analytics ). For data or performance monitoring purposes , we're not speaking so much about the performance of your actual database and its underlying infrastructure, but the performance of the application or system built on top of the database. Imagine I have an application or website that takes reviews, if I build a chart like the one below where I want to easily see when an interaction hits a threshold that I want to dive deeper into, I now have the ability to quickly see the document that created that data point. This chart shows app ratings given after a user session in an app. For this example, we want to dive into any rating that was below a 3 (out of 5). This scatter plot shows I have two such ratings that cross that threshold. With the drill-down capability, I can easily see all the details captured in that user session. For finding new insights, let’s imagine I’m tracking how many transactions happen on my ecommerce site over time. In the column chart below, you can see I have purchases by month for the last year and a half (note, there’s a gap because this example is for a seasonal business!). Just by glancing at the chart, I can quickly see purchases have increased over time, and my in-app purchases have increased my overall sales. However, I want to see more about the documents that were aggregated to create those columns, so I can quickly see details about the transaction amount and location without needing to create another chart or dashboard filter. In both examples, I was able to answer a deeper level question that the original chart couldn’t answer on it’s own. We hope this new feature helps you and your stakeholders get more out of MongoDB Charts, regardless if you’re new to it or have been visualizing your Atlas data with it for months, if not years! If you haven’t tried Charts yet, you can get started for free by signing up for a MongoDB Atlas and deploying a free tier cluster.

April 6, 2021

Add Interactivity to Your Embedded Analytics with Click Events

MongoDB Charts’ data visualizations can now become more interactive, so users and stakeholders can dive deeper into the insights they care more about. That’s possible with a new feature currently in preview with support for most Charts types: click events. A click event in the Charts embedding SDK is simply a notification that a user clicked on a chart. That click could be anything: They might have clicked on a bar in a bar chart, a chart’s legend, or even empty white space within the chart. Web developers can subscribe to these events and create different functionality depending on where the user clicked. Why might you want to enhance your app or embedded analytics workflow with click event data? Click-event data opens up a wide range of possibilities. Here are a couple of examples, inspired by various Charts users who’ve been telling us how they’d like to use click-event data. Open up another chart, based on a user clicking on data within a chart: A logistics company has a bar chart that shows pending orders at an aggregate level per region, and they want to see more detail on pending orders for a specific region. They create a click event handler in their application that opens up a new chart with pending orders per supplier, based on the region selected in the aggregate chart. Filtering the other charts on a dashboard when a series or data point on a single chart is clicked: A retail clothing company has a dashboard with various shopping cart information such as sales, orders processed, and returns, for their portfolio of products. The head of outerwear sales only wants to see data for the “outerwear” category of products, so they click on the “outerwear” series within a bar chart. The rest of the dashboard can adapt so that it shows only information relevant to outerwear. The example below is created from one of our sample data sets. We created two charts in a single app, tied to the sample movie data set that every Atlas user can access. On the left is a stacked bar chart with category level data that includes genre and decade. On the right is a table chart that shows each individual movie within a category. Clicking on a specific category in the bar chart updates the movies shown in the table chart. How can you get started with click events of embedded charts? If you haven’t yet used the embedding SDK for MongoDB Charts, you’ll want to familiarize yourself with the docs , consider watching this video tutorial , and access the SDK via the Charts GitHub repository . Regardless if you’re new to using the SDK or have experience with it, it’s important to note that you will need to use the @mongodb-js/charts-embed-dom@beta tagged version of the SDK to have access to the click events functionality while it’s in preview. There are two examples specifically for click events in the repository: click-events-basic and click-events-filtering . If you just want to explore and test out the functionality, you can play around with them in the following sandboxes using codesandbox.io: Click events basic sandbox Click events filtering sandbox Here’s a snapshot of the data surfaced in a click event that is available for developers to use in their apps. In this example I clicked on the yellow section of the top bar in the Movie Genres chart above. Note how it includes details of the click coordinates, the type and role of the clicked mark, and the corresponding chart data for the mark. { "chartId": "90a8fe84-dd27-4d53-a3fc-0e40392685dd", "event": { "type": "click", "altKey": false, "ctrlKey": false, "shiftKey": false, "metaKey": false, "offsetX": 383, "offsetY": 15, "clientX": 403, "clientY": 99, "pageX": 403, "pageY": 99, "screenX": 756, "screenY": 217 }, "data": { "y": { "label": "Genre", "value": "Drama" }, "x": { "label": "# Movies", "value": 3255 }, "color": { "label": "Decade", "value": "2010 - 2020", "lowerBound": 2010, "upperBound": 2020 } }, "target": { "type": "rect", "role": "mark", "fill": "#F0D175" }, "apiVersion": 1 } Whether you’re an avid user or new to MongoDB Charts, we hope you consider taking advantage of the new click event capability to increase the interactivity of Charts. It’s in preview because there is more functionality still to come. It has yet to be released for a few chart types: geospatial, table, top item, word cloud, and number charts. On that note, we’d love to hear your thoughts through the MongoDB Feedback Engine . If you haven’t tried Charts yet, you can get started for free by signing up for a MongoDB Atlas and deploying a free tier cluster.

January 20, 2021