Avancées dans la base de données d'analyse de liaison quantico-chimique
Une nouvelle base de données améliore la compréhension des liaisons chimiques dans les matériaux à l'état solide.
― 7 min lire
Table des matières
- L'Importance de l'Analyse des Liaisons
- Automatisation en Science des Matériaux
- Efficacité Computationnelle avec DFT
- Utiliser LOBSTER pour l'Analyse des Liaisons
- La Base de Données : Structure et Contenu
- Contrôle de Qualité des Données
- Environnements de Coordination et Charges Atomiques
- Exploration des Données et Fonctions
- Applications d'Apprentissage Automatique
- Conclusion
- Source originale
- Liens de référence
La chimie joue un rôle super important dans la fabrication des Matériaux qu'on utilise tous les jours. Comprendre comment les atomes se lient dans les matériaux solides est essentiel pour créer de nouveaux matériaux avec des propriétés spécifiques. Pour aider à cette compréhension, on a créé une base de données qui se concentre sur les Liaisons chimiques dans les matériaux en état solide, en utilisant des méthodes computationnelles pour analyser les caractéristiques de liaison.
L'Importance de l'Analyse des Liaisons
Les liaisons chimiques déterminent comment les matériaux se comportent. Par exemple, dans les matériaux thermoelectriques, on constate que la faible conductivité thermique est souvent liée à des interactions antibonding fortes. En analysant ces liaisons, on peut quantifier les interactions entre les atomes et obtenir des informations sur les propriétés du matériau. Il existe plusieurs méthodes théoriques pour cette analyse, y compris des approches connues comme la méthode Atoms In Molecules (AIM) et des méthodes basées sur la fonction d'onde, comme l'analyse de population de Mulliken.
Automatisation en Science des Matériaux
Les avancées récentes dans les outils d'automatisation permettent de faire des calculs rapides pour des milliers de matériaux. En utilisant ces outils, les chercheurs peuvent exploiter de grandes quantités de données pour des applications d'apprentissage automatique visant à accélérer la découverte de nouveaux matériaux. L'objectif est de mieux relier la structure des matériaux à leurs propriétés, facilitant ainsi la conception de nouveaux matériaux pour des usages spécifiques.
Efficacité Computationnelle avec DFT
Quand on traite des matériaux en état solide, une approche courante est d'utiliser la théorie de la fonctionnelle de la densité (DFT) avec des ensembles de bases à ondes planes. Cette méthode tire parti de la structure périodique des matériaux pour améliorer l'efficacité computationnelle. Cependant, même si c'est efficace, ça peut aussi entraîner la perte d'informations de liaison spécifiques aux atomes. Pour récupérer ces infos essentielles, on utilise le logiciel LOBSTER, qui projette les données DFT sur des orbitales atomiques locales.
Utiliser LOBSTER pour l'Analyse des Liaisons
LOBSTER est un outil puissant pour extraire des informations de liaison à partir des calculs DFT. Il a été largement utilisé dans diverses études à travers différentes classes de matériaux. Bien que certaines recherches à haut débit sur les matériaux aient été réalisées en utilisant des données LOBSTER, il manquait jusqu'à maintenant une base de données dédiée pour stocker et accéder à ces informations de liaison.
La Base de Données : Structure et Contenu
On a développé une base de données contenant des informations de liaison pour 1520 composés, incluant des isolants et des semi-conducteurs. Ces données sont générées grâce à un flux de travail entièrement automatisé qui combine des calculs DFT avec des analyses LOBSTER. On fournit ces informations sous forme de fichiers JSON faciles à utiliser, ce qui permet aux chercheurs d'accéder et d'utiliser les données facilement.
Génération des Données
Pour créer la base de données, on a utilisé un flux de travail récent qui intègre différents outils Python. Le processus commence par une structure cristalline d'entrée, puis elle est analysée à travers plusieurs étapes computationnelles. Ces étapes incluent la création de fichiers d'entrée pour les exécutions DFT, le calcul statique DFT et l'exécution de LOBSTER pour les analyses de liaison.
Aperçu des Indicateurs de Liaison
En utilisant LOBSTER, on peut projeter des fonctions d'onde sur des orbitales atomiques locales pour quantifier les interactions interatomiques. Les indicateurs de liaison résultants fournissent des informations précieuses sur la nature chimique des matériaux. Les métriques clés dérivées de cette analyse incluent les populations intégrées de l'Hamiltonien d'orbitales cristallines (ICOHP), les populations d'overlap d'orbitales cristallines intégrées (ICOOP) et l'indice de liaison d'orbitales cristallines (COBI).
Contrôle de Qualité des Données
Pour garantir l'intégrité de la base de données, on a effectué des vérifications de qualité sur les données en les comparant avec des références et des résultats computationnels standards déjà disponibles. Par exemple, on a comparé les densités d'états projetées (PDOS) de LOBSTER avec celles calculées par DFT, assurant ainsi une grande précision dans nos analyses de liaison.
Déversement de Charge et Qualité de Projection
Un aspect crucial de notre analyse est l'examen du "déversement de charge", qui se réfère à la perte de densité de charge lors de la projection des fonctions d'onde. Idéalement, une base locale bien représentée devrait donner des valeurs de déversement de charge proches de zéro. On a trouvé qu'environ 99 % des composés de notre base de données montraient un déversement de charge minimal, indiquant des résultats fiables.
Environnements de Coordination et Charges Atomiques
En plus des indicateurs de liaison, on évalue également les environnements de coordination et les charges atomiques dérivées des calculs LOBSTER. En comparant ces valeurs avec des méthodes traditionnelles de détermination des états d'oxydation, on a obtenu un haut niveau d'accord, en particulier au sein des composés ioniques.
Exploration des Données et Fonctions
La base de données permet une exploration approfondie des données de liaison, fournissant des aperçus sur la façon dont la force des liaisons est corrélée avec diverses propriétés des matériaux. Par exemple, en examinant les liaisons covalentes les plus fortes par rapport aux longueurs de liaison, on peut identifier des tendances qui informent la conception de matériaux avec des caractéristiques souhaitées.
Applications d'Apprentissage Automatique
Pour démontrer l'utilité pratique de notre base de données, on a construit un modèle d'apprentissage automatique pour prédire les propriétés phononiques. Le modèle a montré une amélioration significative de la précision lorsqu'il intègre nos descripteurs de liaison, soulignant la valeur des données quantiques-chimiques dans la recherche en science des matériaux.
Création de Caractéristiques pour l'Apprentissage Automatique
Notre approche a consisté à transformer les données de la base de données en caractéristiques adaptées à l'apprentissage automatique. En rassemblant des données statistiques sur les indicateurs de liaison, on a créé un ensemble de caractéristiques complet pour notre modèle. Les résultats révèlent qu'inclure des informations de liaison améliore nettement le pouvoir prédictif des modèles visant à découvrir de nouveaux matériaux.
Conclusion
Le développement de notre base de données de liaison quantique-chimique représente un pas important dans le domaine de la science des matériaux. En combinant des techniques computationnelles avancées avec l'apprentissage automatique, on offre une ressource précieuse pour les chercheurs cherchant à comprendre et à manipuler les propriétés des matériaux en état solide. Ce travail ouvre de nouvelles voies pour la découverte de matériaux, permettant la conception de matériaux avec des propriétés adaptées à diverses applications. La base de données est maintenant disponible pour les chercheurs intéressés par l'exploration du riche monde des liaisons chimiques dans les matériaux solides, encourageant ainsi la découverte et l'innovation.
Titre: A Quantum-Chemical Bonding Database for Solid-State Materials
Résumé: An in-depth insight into the chemistry and nature of the individual chemical bonds is essential for understanding materials. Bonding analysis is thus expected to provide important features for large-scale data analysis and machine learning of material properties. Such chemical bonding information can be computed using the LOBSTER software package, which post-processes modern density functional theory data by projecting the plane wave-based wave functions onto a local, atomic orbital basis. With the help of a fully automatic workflow, the VASP and LOBSTER software packages are used to generate the data. We then perform bonding analyses on 1520 compounds (insulators and semiconductors) and provide the results as a database. The database structure of the bonding analysis database, which allows easy data retrieval, is also explained. The projected densities of states and bonding indicators are benchmarked on standard density-functional theory computations and available heuristics, respectively. Lastly, we illustrate the predictive power of bonding descriptors by constructing a machine-learning model for phononic properties, which shows an increase in prediction accuracies by 27 % (mean absolute errors) compared to a benchmark model differing only by not relying on any quantum-chemical bonding features.
Auteurs: Aakash Ashok Naik, Christina Ertural, Nidal Dhamrait, Philipp Benner, Janine George
Dernière mise à jour: 2023-04-21 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2304.02726
Source PDF: https://arxiv.org/pdf/2304.02726
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://doi.org/10.5281/zenodo.7795903
- https://doi.org/10.5281/zenodo.7802325
- https://doi.org/10.5281/zenodo.7802318
- https://github.com/naik-aakash/Lobsterpy.featurize
- https://github.com/naik-aakash/lobster-database-paper-analysis-scripts
- https://doi.org/10.1002/anie.198708461
- https://doi.org/10.1021/jacs.2c11908
- https://doi.org/10.1002/adfm.202108532
- https://doi.org/10.1016/S0065-3276
- https://doi.org/10.1021/ja00349a027
- https://doi.org/10.1021/j100135a014
- https://doi.org/10.1021/acs.jpcc.1c00718
- https://doi.org/10.1016/j.commatsci.2012.02.005
- https://doi.org/10.1016/j.commatsci.2015.09.013
- https://doi.org/10.1016/j.commatsci.2017.07.030
- https://doi.org/10.1016/j.commatsci.2021.110731
- https://doi.org/10.1038/sdata.2018.65
- https://doi.org/10.1021/jp202489s
- https://doi.org/10.1002/jcc.23424
- https://doi.org/10.1002/jcc.24300
- https://doi.org/10.1002/jcc.26353
- https://doi.org/10.1002/pssr.201800579
- https://doi.org/10.1002/anie.202115778
- https://doi.org/10.1021/acs.chemmater.1c03349
- https://doi.org/10.1016/j.apsusc.2022.156064
- https://doi.org/10.1039/C9SC00485H
- https://doi.org/10.1002/jcc.25822
- https://doi.org/10.1021/jacs.8b04704
- https://doi.org/10.1103/PhysRevMaterials.3.053803
- https://doi.org/10.1021/acscatal.0c04525
- https://doi.org/10.1021/acscatal.1c04408
- https://doi.org/10.1002/cplu.202200123
- https://doi.org/10.1103/PhysRevB.54.11169
- https://doi.org/10.1016/0927-0256
- https://doi.org/10.1103/PhysRevB.47.558
- https://doi.org/10.1016/j.commatsci.2012.10.028
- https://doi.org/10.1002/cpe.3505
- https://doi.org/10.1063/1.4812323
- https://doi.org/10.1039/C9RA05190B
- https://doi.org/10.1103/PhysRevB.46.6671
- https://doi.org/10.1103/PhysRevLett.77.3865
- https://doi.org/10.1103/PhysRevB.59.1758
- https://doi.org/10.1103/PhysRevB.50.17953
- https://web.archive.org/web/20230309085254/
- https://www.vasp.at/wiki/index.php/LORBIT
- https://web.archive.org/web/20230420064340/
- https://github.com/materialsproject/atomate2/tree/de92307b0d3b3bfcb5d66d3073372b7ef01775de
- https://doi.org/10.5281/zenodo.7776029
- https://doi.org/10.1016/0039-6028
- https://doi.org/10.1039/D2SC05772G
- https://doi.org/10.1186/s13321-015-0069-3
- https://doi.org/10.1038/s41597-022-01754-z
- https://doi.org/10.21105/joss.02671
- https://gitlab.com/vibes-developers/vibes/-/tree/master/vibes/materials_fp
- https://doi.org/10.1021/ja00009a002
- https://doi.org/10.1107/S2052520620007994
- https://doi.org/10.1021/acs.inorgchem.0c02996
- https://doi.org/10.1038/s41524-020-00406-3
- https://doi.org/10.1021/acs.chemmater.9b01294
- https://doi.org/10.1038/s41524-021-00650-1
- https://doi.org/10.1038/s41524-021-00552-2
- https://doi.org/10.1088/1361-648X/ac1280
- https://doi.org/10.1039/C5SC00825E
- https://doi.org/10.1016/j.commatsci.2018.05.018
- https://doi.org/10.1023/A:1010933404324
- https://doi.org/10.1002/qua.24917
- https://dx.doi.org/10.1038/npjcompumats.2016.28
- https://arxiv.org/abs/1711.08477
- https://doi.org/10.48550/arXiv.1711.08477
- https://doi.org/10.1038/s42256-019-0138-9
- https://doi.org/10.5281/zenodo.7486816
- https://doi.org/10.5281/zenodo.7794812
- https://doi.org/10.5281/zenodo.7821728