L'informatique des matériaux représente la convergence puissante des simulations numériques à haut débit, de l'apprentissage automatique (ML) et du traitement du langage naturel (NLP) pour accélérer la découverte de nouveaux matériaux. Alors que les simulations quantiques et classiques automatisées ont permis d'établir de vastes bases de données sur les propriétés des matériaux, les progrès récents en NLP et en modèles de langage de grande taille (LLM) permettent désormais une extraction algorithmique massive de données directement à partir de la littérature scientifique.
En intégrant ces diverses sources de données pour entraîner des algorithmes de ML robustes, nous pouvons prédire efficacement le comportement des matériaux et contourner des calculs coûteux en temps processeur. Dans cette présentation, j'exposerai des applications pratiques de ces techniques synergiques dans le secteur de l'énergie. J'aborderai plus précisément l'extraction de données à grande échelle par NLP et LLM pour la prédiction de phase des oxydes à haute entropie. De plus, je mettrai en avant le déploiement de flux de travail d'apprentissage automatique actif (active machine learning) pour la sélection de tensioactifs aux interfaces eau/huile et l'optimisation de nanoparticules pour la réaction d'évolution de l'hydrogène (HER).