Análise Preditiva da Mortalidade Infantil por Causas Evitáveis no Estado do Paraná: Utilizando Machine Learning na Saúde Pública

  • Author
  • Elaine Cristina da Silva Schwab Horst
  • Abstract
  •  

    A mortalidade infantil por causas evitáveis é um indicador importante da saúde pública no Brasil, sendo considerado como evento sentinela, indicando falhas e pontos de atenção na assistência à saúde. Consideram-se óbitos evitáveis aqueles que poderiam ter sido prevenidos por ações efetivas dos serviços de saúde, em tempo hábil e com qualidade. Este estudo pretende utilizar algorítimo de machine learning (aprendizado de máquina) para análise preditiva no índice de Mortalidade Infantil por Causas Evitáveis no estado do Paraná. A análise preditiva utiliza dados que permitem prever o comportamento futuro com base em dados históricos, assim a análise preditiva pode ser usada para prever o risco de determinada situação. Modelos preditivos, se combinados com as medidas de saúde pública, podem impactar de modo positivo, na redução de custos, na efetividade de intervenções e ações preventivas em saude pública.Trata-se de estudo quantitativo, com utilização de algoritmos preditivos que utilizam dados históricos e técnicas estatísticas para realizar previsões sobre o indicador de Mortalidade Infantil por Causas Evitáveis. Num primeiro momento foi realizada coleta de dados dos indicadores de saúde infantil do estado do Paraná de 2012 à 2022, quais sejam, óbitos infantis até 1 ano de idade, óbitos infantis por causas evitáveis (até 1 ano), cobertura da Atenção Primária à Saúde, percentual de gestantes com 7 ou mais consultas pré-natal. A criação do modelo de Regressão Linear foi realizada em linguagem Python da seguinte maneira: os algorítimos foram alimentados com os referidos dados, pré-processados e divididos em dados para treinamento e teste. Para treinamento foram utilizados os dados dos sete primeiros anos (70%), através da função train_test_split do scikit-learn e para teste do desempenho preditivo, os dados dos últimos três anos (30%). Após a etapa de aprendizagem, foram realizadas as predições, através do método predict(). Como resultados preliminares, o modelo de regressão linear sugere que o número de óbitos infantis por causas evitáveis está diminuindo ao longo do tempo. Com relação aos dados de teste, a precisão do modelo, utilizando como métrica de avaliação o Coeficiente de Determinação (R²), foi de 43.31%, apesar de o modelo realizar uma previsão precisa dos dados de óbitos por causas evitáveis, para o ano de 2011, 2019, 2020 e 2021 (dados de teste), a métrica de avaliação indica que o modelo de regressão utilizado não é capaz de explicar adequadamente a variação nos dados e/ou que é necessário considerar outras abordagens de modelagem dos dados ou incluir mais variáveis explicativas para melhorar a precisão do modelo.

       

    • Keywords
    • Mortalidade infantil por causas evitáveis, machine learning, análise preditiva.
    • Subject Area
    • EIXO 3 – Gestão
    Back