Utilização de Machine Learning para o diagnóstico de Leucemia a partir de dados de expressão gênica

  • Autor
  • Joaquim dos Santos Costa
  • Co-autores
  • Maria Eliana da Silva Holanda , Edson Magalhaes da Costa , Jakelyne Machado Lima Silva , Gilberto Nerino de Souza Junior , Marcus de Barros Braga
  • Resumo
  • O grande desafio do tratamento e controle do câncer está no diagnóstico precoce, pois direcionar terapias corretas para seu controle, maximiza a eficácia e minimiza as rejeições no tratamento a longo prazo. A AML (Acute Myeloid Leukemia), ou leucemia mieloide aguda, é um câncer de sangue e da medula óssea onde há excesso de glóbulos brancos imaturos, e proliferação de células patologicamente alteradas na corrente sanguínea. Os sintomas podem incluir fadiga, febre, infecções recorrentes e aparecimento de hematomas. A ALL (Acute Lymphoblastic Leukemia), ou leucemia linfoblástica aguda, também afeta os glóbulos brancos e ocorre quando surge um linfócito imaturo e danificado na medula óssea devido a um erro no DNA. Os sintomas incluem aumento dos gânglios linfáticos, hematomas, febre, dor óssea, sangramento gengival e infecções. Apesar da distinção bem estabelecida entre a AML e a ALL, não há um método eficaz de teste que estabeleça um diagnóstico preciso. Para isso, a prática clínica envolve a expertise de um hematologista para interpretar a morfologia do tumor, a partir de uma série de exames realizados por laboratórios especializados. Deste modo, desenvolver um método de teste eficaz que firme um diagnóstico preciso, otimizará significativamente o tratamento dos tipos de leucemia e suas especificidades. A técnica de microarrays, ganhou visibilidade com a popularização das tecnologias desequenciamento de genomas. Através desta técnica, ainda considerada como padrão ouro, é possível investigar milhares de genes simultaneamente. Nos últimos anos, estudos de expressão gênica têm sido utilizados na oncologia para identificar marcadores moleculares que possam diferenciar perfis de expressão e auxiliar no diagnóstico, classificação e escolha correta do tratamento. Por meio da determinação da expressão de milhares de genes simultaneamente, a técnica de microarrays possibilita realizar a comparação do comportamento molecular de vários tipos de linhagens celulares e tecidos diferentes, quando expostos a uma condição especifica patológica ou experimental. Em 1999, Golub e colaboradores propuseram uma abordagem genérica para classificação do câncer com base no monitoramento da expressão gênica por DNA Microarrays e aplicaram a leucemias agudas humanas. Foi possível então se estabelecer um procedimento de classificação automática entre AML e ALL. Este projeto utilizou dados de expressão gênica e aplicou dois modelos de aprendizado de máquina (machine learning), uma subárea da inteligência artificial, para estabelecer o diagnóstico dos tipos de leucemia (ALL ou AML) a partir dos dados de expressão gênica dos pacientes estudados. Dois modelos foram utilizados, uma máquina de vetor de suporte (support vector machine, SVM) e uma rede neural artificial (artificial neural network, ANN). O SVM conseguiu uma acurácia de classificação de 67% e por isso, outro algoritmo de aprendizado de máquina, o ANN, foi testado. A rede neural obteve um resultado melhor, uma acurácia na classificação de 85%. Futuros trabalhos podem combinar vários algoritmos de inteligentes, abordagem conhecida como machine learning ensemble, para aprimorar o desempenho na classificação destes tipos de leucemia, porém, a abordagem de aprendizado automático já se mostrou capaz de realizar a tarefa do diagnóstico sem a necessidade de intervenção de expertise humana, normalmente requerida na abordagem médica tradicional.

  • Palavras-chave
  • Leucemia, machine learning, expressão gênica.
  • Modalidade
  • Vídeos
  • Área Temática
  • CIÊNCIA DA COMPUTAÇÃO
Voltar Download

O objetivo do Evento é disseminar a visão holística das ações universitárias da Instituição nos seus diversos Campi, além de trazer uma mostra das discussões técnico-científica que vêm sendo trabalhada na nossa Universidade para toda sociedade paraense.

Nesta edição debateremos o tema “Ciência, Tecnologia e Inovação na Amazônia Pós-Pandemia”. A escolha do tema tem por finalidade proporcionar à comunidade acadêmica discussões sobre as possibilidades de desenvolvimento da Amazônia no âmbito da Ciência e Tecnologia no contexto pós-pandêmico.

Excepcionalmente o IV INTEGRA UFRA ocorrerá de forma virtual, respeitando as indicações de distanciamento social, em virtude da pandemia por COVID-19. Desta forma as apresentações dos resumos serão de forma assíncronas e palestras serão transmitidas ao vivo, por meio de sessões virtuais.

Comissão Organizadora

Prof. Dr. Allan Klynger da Silva Lobato
Prof. Dr. Fabio Israel Martins Carvalho
Prof. Dr. Allan Douglas Bento da Costa
Dimas Oliveira da Silva
Tatianne Feitosa Soares

Comissão Científica

Prof. Dr. Allan Klynger da Silva Lobato
Prof. Dr. Fabio Israel Martins Carvalho
Prof. Dr. Allan Douglas Bento da Costa

 

Divisão de Programas Institucionais - DPI

A DPI é responsável pela operacionalização e controle das atividades relacionadas aos programas institucionais de pesquisa, de iniciciação científica e/ou tecnológica, de desenvolvimento tecnológico e inovação da UFRA.

e-mail:

dpi.proped@gmail.com

pibic@ufra.edu.br