Técnicas de Data Science para Descoberta de Conhecimento em Grandes Volumes de Dados Abertos Educacionais

  • Autor
  • Ebony Marques Rodrigues
  • Resumo
  • Este trabalho observou o uso de técnicas dos processos de Knowledge Discovery in Databases (KDD) e Cross Industry Standard Process for Data Mining (CRISP-DM) sobre bases de dados de 2016, 2017 e 2018 do Exame Nacional de Desempenho dos Estudantes (ENADE) e do Censo da Educação Superior visando à descoberta de conhecimentos acerca do contexto de formação de estudantes no âmbito do ensino superior público brasileiro. As técnicas em questão foram empregadas por meio das linguagens de programação Python e R. O estudo tratou da execução de três cenários de mineração de dados, fundamentados por métodos do Aprendizado de Máquina Supervisionado e do Aprendizado de Máquina Não Supervisionado, compreendendo experimentos de classificação, agrupamento e associação de dados. O primeiro cenário, baseado por dados de concluintes de cursos de graduação de graus bacharelado e licenciatura, objetivou classificar estudantes, levando em conta informações socioeconômicas, a partir do tempo aproximado de conclusão da graduação em IES públicas de todo o Brasil, por meio de 16 modelos de classificação construídos com a utilização de algoritmos de Árvore de Decisão, Floresta Aleatória, XGBoost e Rede Neural. Os modelos XGBoost tiveram os melhores resultados em todos os experimentos. O segundo cenário, por sua vez, tratou do uso do algoritmo K-Modes, derivado do K-Means, na execução de um agrupamento de IES públicas brasileiras que possibilitou a identificação de similaridades e dissimilaridades das instituições, com base em um conjunto de características. Os grupos resultantes do agrupamento, além de dados de concluintes de cursos de graduação de graus bacharelado e licenciatura, foram considerados pelos experimentos do terceiro cenário de mineração de dados para a geração de regras de associação, com o emprego do algoritmo Apriori, que podem suportar a descoberta de conhecimento no contexto do ensino superior público brasileiro, observando distintos perfis socioeconômicos de discentes.

  • Palavras-chave
  • Data Science, Machine Learning, Knowledge Discovery in Databases, Cross Industry Standard Process for Data Mining, XGBoost, KModes, Apriori, ENADE, IES
  • Área Temática
  • Estatística e Informática (SEDE)
Voltar

As apresentações ocorreram nos dias 06 e 07 de dezembro de 2021.

  • Administração (SEDE)
  • Agronomia (SEDE)
  • Biologia (SEDE)
  • Ciência Florestal (SEDE)
  • Ciências do Consumo (SEDE)
  • Ciências Sociais (SEDE)
  • Computação (SEDE)
  • Economia (SEDE)
  • Educação (SEDE)
  • Educação Física (SEDE)
  • Engenharia Agrícola (SEDE)
  • Estatística e Informática (SEDE)
  • Física (SEDE)
  • História (SEDE)
  • Letras (SEDE)
  • Matemática (SEDE)
  • Medicina Veterinária (SEDE)
  • Morfologia e Fisiologia Animal (SEDE)
  • Pesca e Aquicultura (SEDE)
  • Química (SEDE)
  • Tecnologia Rural (SEDE)
  • Zootecnia (SEDE)
  • UACSA - Engenharia Civil
  • UACSA - Engenharia de Materiais
  • UACSA - Engenharia Elétrica
  • UACSA - Engenharia Eletrônica
  • UACSA - Engenharia Mecânica
  • UAEADTEC - Administração Pública
  • UAEADTEC - Licenciatura em Artes Visuais com ênfase em Digitais
  • UAEADTEC - Licenciatura da Computação
  • UAEADTEC - Licenciatura em Física
  • UAEADTEC - Licenciatura em História
  • UAEADTEC - Licenciatura em Letras
  • UAEADTEC - Licenciatura em Pedagogia
  • UAEADTEC - Sistema de Informação
  • UAST - Administração
  • UAST - Agronomia
  • UAST - Ciências Biológicas
  • UAST - Ciências Econômicas
  • UAST - Engenharia de Pesca
  • UAST - Licenciatura em Letras
  • UAST - Licenciatura em Química
  • UAST - Sistema de Informação
  • UAST - Zootecnia
  • CODAI
  • Engenharia Ambiental (SEDE)

Comissão Organizadora

Congresso de Iniciação Cientifica - CIC

Comissão Científica

A comissão científica foi formada por mais de 400 avaliadores entre professores dos diferentes Departamentos e Unidades Acadêmicas da UFRPE e pesquisadores doutores de outras instituições do estado de Pernambuco

 

Para maiores informações e-mail: cic@ufrpe.br 

Para certificado de apresentação e menção honrosa enviar e-mail: chamado.ipe@ufrpe.br, informando nome completo do autor principal, título do resumo e todos os co-autores.

Comissão Organizadora Executiva

Marcelo Brito Carneiro Leão – Reitor

Gabriel Rivas de Melo – Vice-Reitor

Ricardo André Cavalcante de Souza – Diretor do Instituto Ipê

Suzianny Maria Bezerra Cabral da Silva – Diretora do Núcleo de Pesquisa

 

Coordenação Geral

Fernando Antonio Aires Lins

Severino Henrique da Costa

 

Comissão Organizadora

Adeilson Pinheiro Sedrins

Adriana Guim

Amanda Brandão Araújo Moreno

Ana Cláudia Vaz De Araújo

Ana Paula Amazonas Soares

Antônio Samuel Alves da Silva

Breno Quintella Farah

Bruno Romero Ferreira Miranda

Carlos André De Carvalho Bosco

Cecília Maria Mota Silva Lins

Cristiane Soares De Mesquita

Eliane Cristina Sampaio de Freitas

Elma Machado Ataíde

Ericka Maria de Melo Rocha Calabria

Erika F. T. Samico Fernandes Cavalcanti

Evandro de Oliveira Cavalcanti

Ewerton Ávila Dos Anjos

Luna Francisco de Assis Leite Souza

Gílcia Aparecida de Carvalho

Gledson Luiz Pontes de Almeida

Joaquim Evêncio Neto

Jorge da Silva Correia

Jucleiton José Rufino De Freitas

Kátia Maria Oliveira de Souza

Luciana Felizardo Pereira Soares

Marcel Ayres De Araújo

Marcilio Martins de Moraes

Maria Ângela Caldas Didier

Maria Betânia De Queiroz Rolim

Maria de Fátima Silva dos Santos

Maria Emília Vasconcelos dos Santos

Maria do Rosário de Fátima Andrade Leitão

Maria Inês Sucupira

Maciel Mauricio Sardá de Faria

Millena de Andrade Almeida Gomes Cavalcanti

Mônica Calixto Ribeiro De Holanda

Natanael Duarte De Azevedo

Oscar Emerson Zúñiga Mosquera

Paula Braga Gomes

Paulo Roberto Campagnoli De Oliveira Filho

Rachel Costa de Azevedo Mello

Rafael Ferreira Leite De Mello

Rafael Miranda Tassitano

Ramón Enrique Ramayo González

Raquel de Aragão Uchôa Fernandes

Renata Barbosa Vicente

Rezilda Rodrigues Oliveira

Ricardo Gallo

Rita de Cássia da Silva L. Barreto

Rogéria Rodrigues

Severino Carlos Bezerra de Oliveira

Thamires Santos Cruz

Victor Wanderley Costa de Medeiros

Watson Arantes Gama Jr