Modelamento de Prospectividade de Cu-Au na Provincia Mineral de Carajás utilizando machine learning: Lidando com dados não balanceados
O modelamento de prospectividade mineral apresenta naturalmente dados de treinamento desequilibrados, uma vez que o número de ocorrências de depósitos minerais conhecidos (como proxy da classe mineralizada ou positiva) é naturalmente muito menor do que o número de locais não mineralizados (a classe negativa). O uso de dados desequilibrados leva a dificuldades no treinamento de modelos de aprendizagem de máquinas, devido ao viés de aprendizagem em relação às características da classe predominante (ou seja, negativa). De acordo com os resultados, um melhor desempenho é alcançado usando o SMOTE quando os modelos prospectivos são treinados com um número igual de amostras mineralizadas e não mineralizadas. O melhor modelo de prospectividade treinado com um conjunto de dados modificado com proporção 600:600 de amostras mineralizadas e não mineralizadas resultou na classificação de 100% dos locais mineralizados de treinamento e quase 80% dos locais mineralizados de teste, e delineou apenas 7% da área de estudo como prospectiva.
Link: https://youtu.be/kVjwAJvFWfA