A informática de materiais representa a poderosa convergência entre simulações computacionais de alto rendimento, Aprendizado de Máquina (ML) e Processamento de Linguagem Natural (PLN) para acelerar a descoberta de materiais. Enquanto simulações quânticas e clássicas automatizadas estabeleceram vastos bancos de dados de propriedades de materiais, avanços recentes em PLN e Modelos de Linguagem de Grande Porte (LLMs) agora permitem a extração algorítmica massiva de dados de materiais diretamente da literatura científica, inclusive dados experimentais.
Ao integrar essas diversas fontes de dados para treinar algoritmos de ML, podemos prever com eficiência o comportamento dos materiais e contornar cálculos computacionalmente dispendiosos. Nesta palestra, apresentarei aplicações práticas dessas técnicas sinérgicas no setor de energia. Especificamente, discutirei a extração de dados da literatura em larga escala usando PLN e LLMs para a previsão de fases em óxidos de alta entropia. Além disso, destacarei a implementação de fluxos de trabalho de aprendizado de máquina ativo para a seleção de surfactantes de interface água/óleo e a otimização de nanopartículas para a Reação de Evolução de Hidrogênio (HER).