BLOGAnnounced at MongoDB.local NYC 2024: A recap of all announcements and updates — Learn more >

Comprendre les grands modèles de langage (LLM) dans le monde de l'intelligence artificielle

Dans le secteur en perpétuelle évolution de l’intelligence artificielle (IA), les grands modèles de langage (LLM) sont devenus des outils puissants qui changent la façon dont nous interagissons avec la technologie, générons du contenu et effectuons diverses tâches de traitement du langage naturel (TAL). Ces derniers permettent de comprendre et de manipuler le langage humain avec une précision et une sophistication inégalées.

Table des matières

Qu'est-ce qu'un grand modèle de langage (LLM) ?

Un LLM, ou grand modèle de langage, est un sous-ensemble des modèles de traitement du langage naturel (TAL). Il désigne une solution d’intelligence artificielle (IA) révolutionnaire. Ces modèles sont soumis à un entraînement intensif sur d’énormes ensembles de données de texte et de code. Ils permettent ainsi de réaliser efficacement un grand nombre de tâches, de la traduction à la création de contenu, en passant par les réponses à vos questions. Les LLM ont redéfini notre interaction avec la technologie, qui s’apparente désormais à une conversation avec un humain très compétent.

L'essor des grands modèles de langage en bref

Les LLM existent depuis plusieurs décennies, mais ce n’est que récemment qu’ils sont devenus suffisamment puissants et sophistiqués pour être utilisés à de nombreuses fins. Le premier LLM a été créé dans les années 1960 avec le premier chatbot, Eliza. Cependant, ses capacités étaient très limitées. Ce n’est que dans les années 2010 qu'ils ont atteint un niveau de fonctionnalité adapté aux très grands modèles et aux applications du monde réel.

L’introduction de l’architecture Transformer en 2017 a marqué un tournant. Ce modèle a considérablement amélioré la compréhension des relations entre les mots dans les phrases. Le texte généré était ainsi correct sur le plan grammatical et cohérent sur le plan sémantique.

Au cours des dernières années, les LLM ont été pré-entraînés sur de vastes ensembles de données de centaines de milliards de textes et de codes. Leurs performances ont ainsi été considérablement améliorées dans divers domaines. Par exemple, certains d'entre eux sont désormais capables de générer du texte impossible à distinguer d'un texte écrit par un humain.

Illustration de l'histoire du développement des grands modèles de langage (LLM)
Qu'est-ce qu'un modèle de transformateurs ?

Ces modèles marquent une étape charnière dans le secteur de l’intelligence artificielle et du traitement du langage naturel. Ils désignent un modèle d’apprentissage profond qui a considérablement transformé diverses tâches liées au langage. Ils sont conçus pour comprendre et générer le langage humain en se concentrant sur les relations entre les mots dans les phrases.

L’une de leurs principales caractéristiques est l'utilisation d’une technique appelée « auto-attention ». Cette technique leur permet de traiter chaque mot d'une phrase en tenant compte du contexte fourni par les autres mots de la même phrase. Cette innovation constitue une rupture significative par rapport aux précédents modèles et explique en grande partie leur succès.

La plupart des grands modèles de langage modernes reposent sur eux. En les utilisant, les développeurs et les chercheurs ont pu créer des systèmes d'IA plus élaborés qui tiennent davantage compte du contexte et qui interagissent avec le langage naturel de manière de plus en plus humaine. L'expérience utilisateur et les applications d'IA se sont ainsi considérablement améliorées.

Comment fonctionnent les grands modèles de langage ?

Les grands modèles de langage utilisent des techniques d'apprentissage profond pour traiter et générer le langage humain.

  1. Collecte de données : la première étape de l'entraînement des LLM consiste à collecter un ensemble massif de données de texte et de code sur Internet. Cet ensemble de données comprend un large éventail de contenus écrits par des humains, afin de leur fournir une base linguistique diversifiée.
  2. Données de pré-entraînement : pendant cette phase, les LLM sont exposés à ce vaste ensemble de données. Ils apprennent à prédire le mot suivant dans une phrase, ce qui les aide à comprendre les relations statistiques entre les mots et les expressions. Ce processus leur permet d'appréhender la grammaire, la syntaxe et même de comprendre en partie le contexte.
  3. Affinage des données : après le pré-entraînement les LLM sont affinés à des fins spécifiques. Cela implique de les exposer à un ensemble de données plus restreint lié à la tâche à réaliser, telle que la traduction, l'analyse de l'opinion ou la génération de texte. Cette mise au point affine leur capacité à effectuer ces tâches efficacement.
  4. Compréhension contextuelle : les LLM prennent en compte les mots qui précèdent et suivent un mot donné dans une phrase. Ils peuvent ainsi générer un texte cohérent et pertinent sur le plan contextuel. Cette caractéristique les distingue des modèles de langage antérieurs.
  5. Adaptation des tâches : grâce à l'affinage, les LLM peuvent s'adapter à un large éventail de tâches. Ils peuvent répondre à des questions, générer du texte semblable à celui rédigé par un humain, traduire, résumer des documents, etc. Cette capacité d'adaptation est l'un de leurs principaux atouts.
  6. Déploiement : une fois entraînés, ils peuvent être exploités dans diverses applications et systèmes. Ils alimentent les chatbots, les moteurs de génération de contenu, les moteurs de recherche et d' autres applications d' IA. L'expérience utilisateur est ainsi optimisée.

En résumé, ils fonctionnent en apprenant d'abord les subtilités du langage humain grâce à un pré-entraînement sur des ensembles de données massifs. Ils affinent ensuite leurs capacités à des fins spécifiques, en s'appuyant sur la compréhension du contexte. Ils peuvent ainsi être utilisés dans de nombreux domaines du traitement du langage naturel.

En outre, il convient de noter que la sélection d'un LLM adapté à vos besoins, ainsi que les processus de pré-entraînement du modèle, d'affinage et d'autres adaptations, se produisent indépendamment d'Atlas (et donc, en dehors d'Atlas Vector Search.).

Quelle est la différence entre un grand modèle de langage (LLM) et le traitement du langage naturel (TAL) ?

Le traitement du langage naturel (TAL) est un domaine de l'informatique qui vise à faciliter les interactions entre les ordinateurs et le langage humain, qu'il s'agisse de la communication orale ou écrite. Il s'agit de donner aux ordinateurs la capacité de comprendre, d'interpréter et de manipuler le langage humain (traduction automatique, reconnaissance vocale, synthèse de texte et réponse à des questions, par exemple).

D’autre part, les LLM constituent une catégorie spécifique de modèles TAL. Ils sont soumis à un entraînement rigoureux sur de vastes référentiels de texte et de code. Ils parviennent ainsi à discerner des relations statistiques complexes entre les mots et les expressions. Par conséquent, les LLM ont la capacité de générer des textes à la fois cohérents et pertinents sur le plan contextuel. Ils peuvent être utilisés pour diverses tâches, notamment la génération de texte, la traduction et la réponse aux questions.

Exemples de grands modèles de langage dans des applications du monde réel
Amélioration du service client

Imaginez une entreprise qui cherche à améliorer son service client. Elle exploite les capacités d'un grand modèle de langage pour créer un chatbot capable de répondre aux demandes des clients concernant leurs produits et services. Ce chatbot est soumis à un processus d'entraînement utilisant de vastes ensembles de données constitués de questions des clients, de réponses correspondantes et d'une documentation détaillée sur les produits. Ce qui distingue ce chatbot, c'est sa compréhension approfondie de l'intention du client. Il donne ainsi des réponses précises et éclairées.

Moteurs de recherche plus intelligents

Les moteurs de recherche font partie de notre quotidien. Or, les LLM les alimentent et les rendent plus intuitifs. Ils peuvent comprendre ce que vous recherchez, même si vous ne le formulez pas parfaitement, et extraire les résultats les plus pertinents à partir de vastes bases de données. Votre expérience de recherche en ligne est ainsi optimisée.

Recommandations personnalisées

Lorsque vous effectuez des achats en ligne ou regardez des vidéos sur des plateformes de streaming, vous voyez souvent des recommandations de produits ou de contenus susceptibles de vous intéresser. Les LLM génèrent ces recommandations intelligentes. Pour ce faire, ils analysent vos habitudes de recherche pour suggérer des éléments qui correspondent à vos goûts. Vos expériences en ligne sont ainsi plus adaptées.

Génération de contenu créatif

Les LLM ne sont pas seulement des processeurs de données. Ce sont aussi des esprits créatifs. Ils disposent d'algorithmes d'apprentissage profond qui peuvent générer du contenu allant des articles de blog aux descriptions de produits, et même de la poésie. Cela permet non seulement de gagner du temps, mais aussi d'aider les entreprises à créer des contenus attrayants pour leur public.

En intégrant les LLM, les entreprises améliorent leurs interactions avec les clients, leurs fonctionnalités de recherche, leurs recommandations de produits et leur création de contenu, et transforment ainsi le paysage technologique.

Types de grands modèles de langage

Les grands modèles de langage (LLM) ne sont pas universels lorsqu'ils sont utilisés dans des tâches de traitement du langage naturel (TAL). Chaque LLM est adapté à des tâches et des applications spécifiques. Il est essentiel de comprendre ces types pour tirer pleinement parti de leur potentiel :

Organigramme illustrant la classification des grands modèles de langage
Modèles pré-entraînés :

Les modèles pré-entraînés tels que GPT-3 (Generative Pre-trained Transformers), T5 (Text-to-Text Transfer Transformer) et XLNet (Extra Large Neural Networks) sont soumis à un entraînement intensif sur des quantités massives de données textuelles. Ils peuvent produire des textes cohérents et corrects sur le plan grammatical sur un grand nombre de sujets qui servent de base à d'autres tâches d'IA, telles que l'entraînement et l'affinage.

Modèles affinés 

Les modèles d'affinage, tels que BERT (Bidirectional Encoder Representations from Transformers), RoBERTa et ALBERT (deux extensions de BERT), sont un autre modèle d'apprentissage automatique pour le TAL. Il s'agit initialement de modèles pré-entraînés, mais ils sont ensuite affinés sur des tâches ou des ensembles de données spécifiques. Ils sont particulièrement adaptés à certaines tâches telles que l'analyse de l'opinion, la réponse aux questions et la classification de textes.

Une représentation visuelle montre les résultats de recherche Google pour les modèles multimodaux.
Modèles multimodaux :

Les modèles multimodaux, dont CLIP et DALL-E, combinent des informations textuelles et visuelles. CLIP est l'abréviation de « Contrastive Language-Image Pre-training ». Le nom DALL-E est un jeu de mots entre « Dali » (en référence à l'artiste Salvador Dalí) et « Wall-E » (le robot animé du dessin animé Pixar). Tous deux sont connus pour leur capacité à effectuer des tâches qui impliquent de relier des informations visuelles et textuelles.

Image montrant un fauteuil en forme d'avocat

En résumé, les modèles pré-entraînés offrent une base étendue, les modèles affinés se spécialisent dans des tâches spécifiques et les modèles multimodaux combinent texte et images. Le choix du modèle dépend de vos besoins et de la complexité de la tâche à accomplir.

Atlas Vector Search : accélérez vos projets de création d'applications de recherche avancée et d'IA générative

Dans notre monde en perpétuelle évolution, MongoDB Atlas Vector Search fait passer la technologie LLM au niveau supérieur en s'intégrant à un grand nombre de LLM et de frameworks populaires et en facilitant le démarrage de la création d'une application d'IA. Par exemple, vous pouvez utiliser Atlas Vector Search pour :

  • stocker et rechercher des vector embeddings générées par OpenAI, Hugging Face et Cohere, ainsi que vos données sources et vos métadonnées. Vous pouvez ainsi créer des applications d'IA générative très performantes, capables de générer du texte, de traduire et de répondre à des questions de manière plus complète et plus pertinente, sans avoir à gérer diverses bases de données opérationnelles et vectorielles ; fournir une mémoire à long terme aux LLM avec la génération augmentée de récupération (RAG) et des intégrations avec des frameworks d'application tels que LangChain et LlamaIndex. Atlas Vector Search fournit le contexte commercial pertinent à partir de données propriétaires à un LLM. Cet outil leur ainsi permet d'apprendre de leurs interactions avec les utilisateurs au fil du temps et de fournir des réponses plus personnalisées et pertinentes, réduisant ainsi les hallucinations ;
  • visualiser et explorer facilement les données de vector embedding dans le navigateur web avec Nomic.
  • créer des applications LLM en C# et Python avec Microsoft Semantic Kernel.
Image illustrant la recherche vectorielle et les applications d'IA génératives

Si vous souhaitez créer des applications de recherche avancée et d’IA générative, Atlas Vector Search est un excellent point de départ. Atlas Vector Search fournit une plateforme puissante et flexible pour développer et déployer des applications d'IA.

Découvrez MongoDB Atlas Vector Search dès aujourd'hui !

Démarrer avec MongoDB Atlas

Essayez gratuitement