Desvendando composições com absorção de raios-X e machine learning: Ampliando a base de dados "Cruzeiro do Sul"

  • Autor
  • Pedro Henrique Sophia
  • Co-autores
  • Ana Clara Santos Brandão , Igor Torquato , Santiago Jose Alejandro Figueroa , James Moraes de Almeida
  • Resumo
  • A técnica de absorção de raios X é muito atrativa devido à sua sensibilidade atômica e versatilidade. Atualmente, a comunidade científica tem conhecimento computacional e ferramentas à sua disposição para interpretar espectros de absorção. No entanto, estas possibilidades estão normalmente sujeitas a consulta de bases de dados experimental, que atualmente possui um volume de dados muito limitado. No SIRIUS [1], na linha QUATI [2] a ideia de ter um banco de dados experimental é atrativa devido à abundância de dados a serem gerados e processados internamente. O objetivo principal deste trabalho foi desenvolver, para a base de dados "Cruzeiro do Sul", um algoritmo capaz de interpretar espectros [3]. Com uma abordagem de aprendizado de máquina, o espectro submetido ao algoritmo será comparado com todos os espectros experimentais presentes na base de dados e, por meio de um algoritmo genético, o usuário terá informações da composição daquela amostra, e o espectro submetido será armazenado na base de dados, aumentando cada vez mais as informações presentes na base. O algoritmo genético desenvolvido utiliza métodos de comparação de curvas para comparar combinações lineares de espectros conhecidos, e soluciona o principal problema dessa abordagem: a imensa quantidade de possíveis combinações. Na prática, o espectro de absorção de raios-x de uma amostra a qual se tem poucas informações pode ser descrita. Se tal amostra possui várias fases cristalinas em sua composição, pode ser inviável para um pesquisador identificar quais são essas fases apenas com sua intuição. O custo computacional de tentar todas as combinações possíveis com os espectros disponíveis em uma base de dados pode ser inviável, principalmente para combinações de mais de dois materiais, uma vez que a complexidade do problema aumenta rapidamente. Portanto, a utilização de algoritmos genéticos é uma alternativa que pode tornar viável e rápida tal tarefa. Com isso, tal técnica pode ser utilizada em uma simples página web, na qual o usuário poderá submeter seu espectro e obter as possíveis componentes de sua amostra.[1] L. Liu, et al. J. Synchrotron Radiat. (2014) 21, 904–911[2] S.J.A. Figueroa, et al. Rad. Phys. and Chem. (2023) 212, 111198.[3] S.J.A. Figueroa, James M. Almeida, Projeto de Bolsas de Verão 2023, PBV 30: "Desenvolvimento de bases de dados e simulações computacionais para resolver problemas de identificação de medidas espectroscópicas e cristalográficas"

  • Palavras-chave
  • Absorção de raios-x, XANES, EXAFS, Machine Learning, Algoritmo Genético, Base de dados, XAS, comparação de espectros
  • Modalidade
  • Pôster
  • Área Temática
  • Nanociência e Nanotecnologia
Voltar

Bem-vindo(a) aos Anais do VII NanoMat, evento organizado pela Pós-graduação em Nanociências e Materiais Avançados da Universidade Federal do ABC (UFABC) com o intuito de reunir e debater trabalhos desenvolvidos por alunos e pós-doutorandos em Materiais e áreas afins.

  • Nanociência e Nanotecnologia
  • Materiais Funcionais Avançados

Comissão Organizadora

Pedro Alves da Silva Autreto
Andre Luiz Martins de Freitas
Aryane Tofanello

Comissão Científica