Skip to main content

CAMBRIDGE : IDTechEx analyse l’impact des grands mo…

Print Friendly, PDF & Email
Floriane Dumont
13 Avr 2024

Partager :

CAMBRIDGE : IDTechEx analyse l’impact des grands modèles linguistiques sur le paysage du développement des matériaux

L’auteur : Sam Dale, analyste technologique principal chez IDTechEx.

L’informatique des matériaux applique des stratégies basées sur les données à la R&D sur les matériaux. Bien avant que la technologie de l’IA générative n’atteigne son apogée, elle avait une longue histoire de succès dans ce domaine. Une approche courante consiste à utiliser des modèles d’apprentissage automatique formés sur des bases de données de structures et de propriétés de matériaux, qui capturent ensuite la relation structure-propriété sous-jacente. En inversant ces modèles avec des propriétés optimisées, de nouveaux matériaux potentiels peuvent être suggérés pour une étude plus approfondie. Les grands modèles linguistiques (LLM), tels que les modèles GPT3.5/4 à l’origine de ChatGPT et Copilot de Microsoft, utilisent des tactiques similaires pour modéliser le langage : en 2024, leur capacité à améliorer le développement des matériaux devient évidente.

Comme le détaille le récent rapport d’IDTechEx, « Informatique des matériaux 2024-2034 : marchés, stratégies, acteurs« , un obstacle important à la rentabilité des logiciels d’informatique des matériaux est le niveau d’implication humaine nécessaire pour intégrer les nouveaux clients à une plateforme et mettre leurs données dans un format utilisable. Cela peut faire ressembler les activités d’une entreprise SaaS à celles d’une société de conseil, réduisant ainsi sa capacité à s’adapter. Les LLM offrent une bouée de sauvetage aux fournisseurs de logiciels et aux utilisateurs finaux.

Renforcer le pouvoir des LLM

Grâce à la génération augmentée par récupération (RAG), un MLD peut agir comme un expert en la matière en lui donnant accès à une bibliothèque de textes et d’autres données qu’il peut interroger sans que le propriétaire du MLD ne puisse voir ces données. L’analogie est la transformation d’un examen à livre fermé en un examen à livre ouvert, le modèle n’étant pas réentraîné sur de nouvelles données. Il s’agit là de l’outil essentiel qui donne aux MLD le pouvoir de transformer l’informatique des matériaux, l’un des facteurs clés étant la capacité à définir des approches pour résoudre les problèmes liés à l’informatique des matériaux.

Un premier exemple commercial provient de FEHRMANN MaterialsX, la division de technologie des matériaux d’une entreprise allemande de longue date spécialisée dans les alliages. MaterialsX a initialement fourni au modèle GPT-4 d’OpenAI, par l’intermédiaire de RAG, environ 40 000 pages de livres, de documents et d’autres informations spécialisées sur le développement des matériaux et les alliages, auxquelles se sont ajoutées de nombreuses autres pages depuis lors. MaterialsX a cité le cas d’un chercheur d’une université technique allemande qui a posé au modèle une question technique complexe sur les alliages, à laquelle l’équipe a mis une dizaine de jours à répondre : le modèle n’a mis que 30 secondes. L’entreprise affirme qu’elle peut aider à définir une méthodologie de recherche complète pour résoudre les problèmes de développement d’alliages, en s’interfaçant avec d’autres modèles d’apprentissage automatique et une série d’ensembles de données pour suggérer de nouveaux matériaux candidats. Suivant un exemple similaire, RAG pourrait être utilisé pour améliorer la capacité d’un LLM à comprendre n’importe quel domaine de la science des matériaux, avec la possibilité de personnaliser les informations fournies au LLM en utilisant les propres données internes du client.

Aplanir les courbes d’apprentissage

L’utilisation de LLM améliorés par RAG permet de réduire les barrières à l’entrée dans l’informatique des matériaux : au lieu de devoir former les scientifiques des matériaux à l’utilisation d’une nouvelle interface utilisateur graphique ou d’utiliser un code pour poser des problèmes à un ordinateur, le langage naturel peut devenir l’interface à la place. Cela pourrait contribuer à augmenter le marché total adressable pour les entreprises d’informatique des matériaux : les organisations en phase de démarrage et les entreprises dotées de petits départements de développement des matériaux, par exemple, pourraient soudain devenir des clients viables.

Le rôle d’une entreprise d’informatique des matériaux est de relier l’expertise des scientifiques des matériaux et des scientifiques/ingénieurs des données pour stimuler le développement des matériaux. La fonction Catalyst de la plateforme de Citrine Informatics utilise les LLM pour faciliter cette connexion de plusieurs façons. L’une des facettes clés est Catalyst Model Expert, qui permet d’utiliser le langage naturel pour injecter des connaissances sur les relations entre les propriétés dans les modèles d’apprentissage automatique. Il est ainsi plus facile pour les scientifiques des matériaux d’utiliser pleinement leur connaissance du domaine pour obtenir les meilleurs résultats des logiciels d’informatique des matériaux.

Bien entendu, tous ces avantages sont inutiles sans un ensemble de données sur lequel former des modèles de comportement des matériaux. La collecte et le nettoyage de données provenant de diverses sources est souvent un élément qui prend beaucoup de temps dans les projets d’informatique des matériaux, notamment en raison de la difficulté de normaliser les données dans l’industrie des matériaux. Les LLM pourraient aider les organisations ici aussi, en étant utilisés pour construire des pipelines et extraire des données à partir de feuilles Excel isolées et de divers fichiers en nuage que de nombreuses entreprises de matériaux utilisent encore pour stocker des données. Bien que la vérification manuelle reste une étape importante, les LLM pourraient constituer un outil majeur pour atténuer le dilemme du nettoyage des données dans l’informatique des matériaux.

Perspectives d’avenir

Les problèmes de sécurité des données constituent le principal obstacle à l’adoption des LLM dans le domaine de l’informatique des matériaux pour de nombreuses organisations. L’une des craintes est que les fournisseurs de LLM puissent accéder aux données propriétaires utilisées dans les RAG. Une approche pourrait consister à utiliser un LLM à source ouverte fonctionnant localement, mais il serait probablement difficile d’égaler les capacités des modèles propriétaires.

Le défi pour les acteurs SaaS de l’informatique matérielle et les fournisseurs de LLM est de rassurer leurs clients sur leurs pratiques en matière de sécurité des données. Compte tenu de l’accélération de l’adoption des LLM dans d’autres secteurs sensibles aux données, comme la collaboration entre PwC, OpenAI et Harvey pour former et déployer des modèles de base pour les applications fiscales, juridiques et de ressources humaines, il semble probable que la confiance s’accroisse avec le temps.

Dans l’ensemble, il est clair que les LLM auront un effet significatif sur le marché de l’informatique des matériaux, en rendant les logiciels plus faciles à utiliser, en améliorant l’intégration des connaissances des scientifiques des matériaux dans les modèles d’apprentissage automatique et en facilitant le processus de collecte des données. Il ne s’agit là que d’une petite sélection des avantages, les véritables effets de ces outils devant apparaître au cours des prochaines années.

Plus d’informations

Le rapport d’IDTechEx, « Materials Informatics 2024-2034 : Markets, Strategies, Players », en est à sa quatrième édition depuis qu’IDTechEx a commencé à couvrir ce domaine en 2020. S’appuyant sur des entretiens de première main avec les principaux acteurs du secteur, le rapport fournit des prévisions de marché, des profils d’acteurs, des investissements, des feuilles de route et des listes complètes d’entreprises, ce qui en fait une lecture essentielle pour tous ceux qui souhaitent prendre de l’avance dans ce domaine.

Pour en savoir plus sur ce rapport IDTechEx, et notamment pour télécharger des exemples de pages, veuillez consulter le site www.IDTechEx.com/MaterialsInformatics.

Pour consulter l’ensemble des études de marché sur les matériaux avancés et les minéraux critiques réalisées par IDTechEx, veuillez vous rendre sur le site www.IDTechEx.com/Research/AM.

À propos d’IDTechEx :

IDTechEx fournit des recherches indépendantes et fiables sur les technologies émergentes et leurs marchés. Depuis 1999, nous aidons nos clients à comprendre les nouvelles technologies, leurs chaînes d’approvisionnement, les exigences du marché, les opportunités et les prévisions. Pour plus d’informations, contactez research@IDTechEx.com ou visitez www.IDTechEx.com.